Buat sebuah klaster dengan Hudi terinstal - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Buat sebuah klaster dengan Hudi terinstal

Dengan Amazon EMR rilis versi 5.28.0 dan yang lebih baru, Amazon EMR menginstal komponen Hudi secara default ketika Spark, Hive, atau Presto diinstal. Untuk menggunakan Hudi di Amazon EMR, buat cluster dengan satu atau beberapa aplikasi berikut yang diinstal:

  • Hadoop

  • Hive

  • Spark

  • Presto

  • Flink

Anda dapat membuat klaster menggunakan AWS Management Console, AWS CLI, atau API Amazon EMR.

  1. Arahkan ke konsol EMR Amazon baru dan pilih Beralih ke konsol lama dari navigasi samping. Untuk informasi selengkapnya tentang apa yang diharapkan saat beralih ke konsol lama, lihat Menggunakan konsol lama.

  2. Pilih Buat klaster, Buka opsi lanjutan.

  3. Dalam Konfigurasi Perangkat Lunak, pilih emr-5.28.0 atau versi lebih baru untuk Rilis dan pilih Hadoop, Hive, Spark, Presto, dan Tez bersama dengan aplikasi lain yang diminta klaster Anda.

  4. Konfigurasikan pilihan lain yang diperlukan untuk aplikasi Anda, dan kemudian pilih Selanjutnya.

  5. Konfigurasikan opsi untuk Perangkat keras dan Pengaturan klaster umum seperti yang diinginkan.

  6. Untuk Opsi keamanan, kami menyarankan Anda untuk memilih pasangan kunci EC2 yang dapat Anda gunakan untuk terhubung ke baris perintah simpul utama menggunakan SSH. Hal ini memungkinkan Anda untuk menjalankan perintah Spark shell, perintah Hive CLI, dan perintah Hudi CLI yang dijelaskan dalam panduan ini.

  7. Pilih opsi keamanan lain seperti yang diinginkan, dan kemudian pilih Buat kluster.