Mengonfigurasi metastore eksternal untuk Hive - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mengonfigurasi metastore eksternal untuk Hive

Secara default, Hive mencatat informasi metastore dalam database MySQL pada sistem file node utama. metastore berisi deskripsi tabel dan data yang mendasari yang dibangun, termasuk nama partisi, tipe data, dan sebagainya. Ketika sebuah cluster berakhir, semua node cluster ditutup, termasuk node utama. Ketika hal ini terjadi, data lokal hilang karena sistem file simpul menggunakan penyimpanan sementara. Jika Anda membutuhkan metastore untuk bertahan, Anda harus membuat metastore eksternal yang ada di luar cluster.

Anda memiliki dua pilihan untuk metastore eksternal:

catatan

Jika Anda menggunakan Hive 3 dan menemukan terlalu banyak koneksi ke Hive metastore, konfigurasikan parameter datanucleus.connectionPool.maxPoolSize agar memiliki nilai yang lebih kecil atau tingkatkan jumlah koneksi yang dapat ditangani oleh server database. Peningkatan jumlah koneksi disebabkan oleh cara Hive menghitung jumlah maksimum koneksi JDBC. Untuk menghitung nilai optimal untuk kinerja, lihat Hive Configuration Properties.