Menggunakan Hue dengan basis data remote di Amazon RDS - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menggunakan Hue dengan basis data remote di Amazon RDS

Secara default, informasi pengguna Hue dan sejarah kueri disimpan dalam basis data MySQL lokal pada simpul utama. Atau, Anda dapat membuat satu klaster yang diaktifkan Hue atau lebih menggunakan konfigurasi yang disimpan di Amazon S3 dan basis data MySQL di Amazon Relational Database Service (Amazon RDS). Hal ini memungkinkan Anda untuk mempertahankan informasi pengguna dan sejarah kueri yang dibuat oleh Hue tanpa menjaga klaster Amazon EMR Anda berjalan. Kami merekomendasikan menggunakan enkripsi sisi server Amazon S3 untuk menyimpan file konfigurasi.

Pertama-tama buat basis data remote untuk Hue.

Untuk membuat basis data MySQL eksternal
  1. Buka konsol Amazon RDS di https://console.aws.amazon.com/rds/.

  2. Klik Luncurkan sebuah Instans DB.

  3. Pilih MySQL dan klik Pilih.

  4. Tinggalkan pilihan default dari Deployment Multi-AZ dan Penyimpanan Provisioned IOPS dan klik Selanjutnya.

  5. Tinggalkan Spesifikasi Instance pada default mereka, tentukan Pengaturan, dan klik Selanjutnya.

  6. Pada halaman Konfigurasi Pengaturan Lanjut, pilih grup keamanan yang tepat dan nama basis data. Grup keamanan yang Anda gunakan harus setidaknya memungkinkan masuknya akses TCP untuk port 3306 dari simpul utama klaster Anda. Jika belum membuat klaster saat ini, Anda dapat mengizinkan semua host untuk menyambung ke port 3306 dan menyesuaikan grup keamanan setelah Anda meluncurkan klaster. Klik Luncurkan Instans DB.

  7. Dari Dasbor RDS, pilih Instans dan pilih instans yang baru saja Anda buat. Ketika basis data Anda tersedia, buat catatan dari dbname, nama pengguna, kata sandi, dan hostname instans RDS. Anda menggunakan informasi ini ketika membuat dan mengonfigurasi klaster Anda.

Untuk menentukan basis data MySQL eksternal untuk Hue ketika meluncurkan sebuah klaster menggunakan AWS CLI

Untuk menentukan basis data MySQL eksternal untuk Hue ketika meluncurkan sebuah klater menggunakan AWS CLI, gunakan informasi yang Anda catat saat membuat instans RDS untuk mengonfigurasi hue.ini dengan objek konfigurasi

catatan

Anda dapat membuat beberapa klaster yang menggunakan basis data eksternal yang sama, tetapi setiap klaster akan berbagi riwayat kueri dan informasi pengguna.

  • Menggunakan AWS CLI, buat klaster dengan Hue terinstal, menggunakan basis data eksternal yang Anda buat, dan mereferensikan file konfigurasi dengan klasifikasi konfigurasi untuk Hue yang menentukan properti basis data. Contoh berikut membuat klaster dengan Hue terinstal, mereferensikan file konfigurasi di Amazon S3, myConfig.json, yang menentukan konfigurasi basis data.

    catatan

    Karakter lanjutan baris Linux (\) disertakan agar mudah dibaca Karakter ini bisa dihapus atau digunakan dalam perintah Linux. Untuk Windows, hapus atau ganti dengan tanda sisipan (^).

    aws emr create-cluster --release-label emr-5.36.0 --applications Name=Hue Name=Spark Name=Hive \ --instance-type m5.xlarge --instance-count 3 \ --configurations https://s3.amazonaws.com/mybucket/myfolder/myConfig.json --use-default-roles

    Contoh isi myConfig.json file ditampilkan di bawah ini. Ganti dbname, nama pengguna, kata sandi, dan Hostname instans RDS dengan nilai-nilai yang Anda catat sebelumnya di Dashboard RDS.

    [{ "Classification": "hue-ini", "Properties": {}, "Configurations": [ { "Classification": "desktop", "Properties": {}, "Configurations": [ { "Classification": "database", "Properties": { "name": "dbname", "user": "username", "password": "password", "host": "RDS instance hostname", "port": "3306", "engine": "mysql" }, "Configurations": [] } ] } ] }]

Pemecahan Masalah

Dalam hal failover Amazon RDS

Ada kemungkinan pengguna mengalami penundaan saat menjalankan kueri karena instans basis data Hue tidak responsif atau sedang dalam proses failover. Berikut ini adalah beberapa fakta dan pedoman untuk masalah ini:

  • Jika Anda login ke konsol Amazon RDS, Anda dapat mencari peristiwa failover. Sebagai contoh, untuk melihat apakah failover dalam proses atau telah terjadi, cari peristiwa seperti "Multi-AZ instans failover dimulai" dan "Multi-AZ instans failover selesai."

  • Dibutuhkan sekitar 30 detik untuk instans RDS bisa menyelesaikan failover.

  • Jika Anda mengalami longer-than-normal respons untuk kueri d, cobalah untuk kembali mengeksekusi kueri.