Konfigurasi perangkat lunak klaster - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Konfigurasi perangkat lunak klaster

Saat Anda memilih rilis perangkat lunak, Amazon EMR menggunakan Amazon Machine Image (AMI) dengan Amazon Linux untuk menginstal perangkat lunak yang Anda pilih saat meluncurkan klaster, seperti Hadoop, Spark, dan Hive. Amazon EMR menyediakan rilis baru secara berkala, menambahkan fitur baru, aplikasi baru, dan pembaruan umum. Kami menyarankan Anda menggunakan rilis terbaru untuk meluncurkan klaster bila memungkinkan. Rilis terbaru adalah opsi default jika Anda meluncurkan klaster dari konsol.

Untuk informasi selengkapnya tentang rilis Amazon EMR dan versi perangkat lunak yang tersedia dengan setiap rilis, buka Panduan Rilis Amazon EMR. Untuk informasi selengkapnya tentang cara mengedit konfigurasi default aplikasi dan perangkat lunak yang diinstal di klaster Anda, buka Mengonfigurasi aplikasi di Panduan Rilis Amazon EMR. Beberapa versi komponen ekosistem Hadoop dan Spark sumber terbuka yang disertakan dalam rilis Amazon EMR memiliki patch dan peningkatan, yang mana didokumentasikan dalam Panduan Rilis Amazon EMR.

Selain perangkat lunak dan aplikasi standar yang tersedia untuk diinstal di klaster, Anda dapat menggunakan tindakan bootstrap untuk menginstal perangkat lunak kustom. Tindakan bootstrap adalah skrip yang berjalan pada instans saat klaster Anda diluncurkan, dan yang berjalan pada simpul baru yang ditambahkan ke klaster Anda saat dibuat. Tindakan bootstrap juga berguna untuk memanggil AWS CLI perintah pada setiap node untuk menyalin objek dari Amazon S3 ke setiap node di cluster Anda.

catatan

Tindakan bootstrap digunakan secara berbeda-beda di Amazon EMR rilis 4.x dan yang lebih baru. Untuk informasi lebih lanjut tentang perbedaan ini dari AMI Amazon EMR versi 2.x dan 3.x, buka Perbedaan yang diperkenalkan di 4.x di Panduan Rilis Amazon EMR.