Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mengonfigurasi lokasi untuk keluaran EMR kluster Amazon
Format keluaran yang paling umum dari EMR cluster Amazon adalah sebagai file teks, baik terkompresi atau tidak terkompresi. Biasanya, ini ditulis ke bucket Amazon S3. Bucket ini harus dibuat sebelum Anda meluncurkan klaster. Anda menentukan S3 bucket sebagai lokasi output ketika Anda memulai klaster.
Untuk informasi selengkapnya, lihat topik berikut:
Topik
Buat dan konfigurasikan bucket Amazon S3
Amazon EMR (AmazonEMR) menggunakan Amazon S3 untuk menyimpan data input, file log, dan data output. Amazon S3 mengacu pada lokasi penyimpanan ini sebagai bucket. Bucket memiliki batasan dan batasan tertentu agar sesuai dengan Amazon DNS S3 dan persyaratan. Untuk informasi lebih lanjut, kunjungi Pembatasan dan Batasan Bucket dalam Panduan Developer Amazon Simple Storage Service.
Untuk membuat bucket Amazon S3, ikuti petunjuk di halaman Membuat bucket dalam Panduan Developer Amazon Simple Storage Service.
catatan
Jika Anda mengaktifkan pencatatan log di panduan Membuat Bucket, ini hanya mengaktifkan log akses bucket, bukan log cluster.
catatan
Untuk informasi selengkapnya tentang menentukan bucket khusus Wilayah, lihat Bucket dan Wilayah di Panduan Pengembang Layanan Penyimpanan Sederhana Amazon dan Titik Akhir Wilayah yang Tersedia
Setelah Anda membuat bucket, Anda dapat mengatur izin yang sesuai terhadapnya. Biasanya, Anda memberi diri Anda (pemilik) akses baca dan tulis. Kami sangat menyarankan agar Anda mengikuti Praktik Terbaik Keamanan untuk Amazon S3 saat mengonfigurasi bucket Anda.
Bucket Amazon S3 yang diperlukan harus ada sebelum Anda dapat membuat klaster. Anda harus mengunggah skrip atau data yang diperlukan yang dimaksud dalam klaster ke Amazon S3. Tabel berikut menjelaskan contoh data, skrip, dan lokasi berkas log.
Informasi | Contoh Lokasi di Amazon S3 |
---|---|
skrip atau program |
s3://amzn-s3-demo-bucket1/script/MapperScript.py
|
berkas log |
s3://amzn-s3-demo-bucket1/logs
|
data input |
s3://amzn-s3-demo-bucket1/input
|
data output |
s3://amzn-s3-demo-bucket1/output
|