Buat sebuah klaster dengan Hudi terinstal - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Buat sebuah klaster dengan Hudi terinstal

Dengan Amazon EMR rilis versi 5.28.0 dan yang lebih baru, Amazon EMR menginstal komponen Hudi secara default ketika Spark, Hive, atau Presto diinstal. Untuk menggunakan Hudi di Amazon EMR, buat klaster dengan satu atau beberapa aplikasi berikut yang diinstal:

  • Hadoop

  • Hive

  • Spark

  • Presto

  • Flink

Anda dapat membuat klaster menggunakan AWS Management Console, AWS CLI, atau API Amazon EMR.

  1. Buka konsol Amazon EMR di https://console.aws.amazon.com/emr.

  2. Pilih Buat klaster, Buka opsi lanjutan.

  3. Dalam Konfigurasi Perangkat Lunak, pilih emr-5.28.0 atau versi lebih baru untuk Rilis dan pilih Hadoop, Hive, Spark, Presto, dan Tez bersama dengan aplikasi lain yang diminta klaster Anda.

  4. Konfigurasikan pilihan lain yang diperlukan untuk aplikasi Anda, dan kemudian pilih Selanjutnya.

  5. Konfigurasikan opsi untuk Perangkat keras dan Pengaturan klaster umum seperti yang diinginkan.

  6. Untuk Opsi keamanan, kami menyarankan Anda untuk memilih pasangan kunci EC2 yang dapat Anda gunakan untuk terhubung ke baris perintah simpul utama menggunakan SSH. Hal ini memungkinkan Anda untuk menjalankan perintah Spark shell, perintah Hive CLI, dan perintah Hudi CLI yang dijelaskan dalam panduan ini.

  7. Pilih opsi keamanan lain seperti yang diinginkan, dan kemudian pilih Buat kluster.