Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pertimbangan penting saat membuat klaster EMR Amazon adalah bagaimana Anda mengonfigurasi EC2 instans Amazon dan opsi jaringan. Bab ini mencakup opsi-opsi berikut, dan kemudian mengikat semuanya bersama-sama dengan praktik terbaik dan panduan.
-
Jenis node — EC2 Instance Amazon dalam cluster EMR diatur ke dalam tipe node. Ada tiga: node primer, node inti, dan node tugas. Setiap jenis simpul melakukan serangkaian peran yang ditentukan oleh aplikasi terdistribusi yang Anda instal di klaster. Selama pekerjaan Hadoop MapReduce atau Spark, misalnya, komponen pada inti dan node tugas memproses data, mentransfer output ke Amazon S3 atau HDFS, dan memberikan metadata status kembali ke node utama. Dengan cluster simpul tunggal, semua komponen berjalan pada simpul utama. Untuk informasi selengkapnya, lihat Memahami jenis node di Amazon EMR: node primer, inti, dan tugas.
-
EC2 instance — Saat membuat klaster, Anda membuat pilihan tentang EC2 instans Amazon yang akan dijalankan oleh setiap jenis node. Jenis EC2 instance menentukan profil pemrosesan dan penyimpanan node. Pilihan EC2 instans Amazon untuk node Anda penting karena menentukan profil kinerja masing-masing tipe node di cluster Anda. Untuk informasi selengkapnya, lihat Konfigurasikan jenis EC2 instans Amazon untuk digunakan dengan Amazon EMR.
-
Jaringan - Anda dapat meluncurkan cluster EMR Amazon Anda ke dalam VPC menggunakan subnet publik, subnet pribadi, atau subnet bersama. Konfigurasi jaringan Anda menentukan bagaimana pelanggan dan layanan dapat terhubung ke klaster untuk melakukan pekerjaan, bagaimana klaster terhubung ke penyimpanan data dan sumber daya AWS lainnya, dan opsi yang Anda miliki untuk mengontrol lalu lintas koneksi tersebut. Untuk informasi selengkapnya, lihat Konfigurasikan jaringan di VPC untuk Amazon EMR.
-
Pengelompokan instans — Kumpulan EC2 instance yang meng-host setiap tipe node disebut armada instance atau grup instance seragam. Konfigurasi pengelompokan instans adalah pilihan yang Anda buat saat membuat klaster. Pilihan ini menentukan bagaimana Anda dapat menambahkan simpul ke klaster Anda saat sedang dijalankan. Konfigurasi ini berlaku untuk semua jenis simpul. Hal ini tidak dapat diubah nanti. Untuk informasi selengkapnya, lihat Membuat klaster EMR Amazon dengan armada instans atau grup instans seragam.
catatan
Konfigurasi armada instance hanya tersedia di Amazon EMR rilis 4.8.0 dan yang lebih baru, tidak termasuk 5.0.0 dan 5.0.3.