Konektor dan utilitas - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Konektor dan utilitas

Amazon EMR menyediakan beberapa konektor dan utilitas untuk mengakses layanan AWS lainnya sebagai sumber data. Anda biasanya dapat mengakses data dalam layanan ini dalam sebuah program. Misalnya, Anda dapat menentukan pengaliran Kinesis dalam kueri Hive, skrip Pig, atau MapReduce aplikasi dan kemudian beroperasi pada data tersebut.

Pembersihan setelahDistCp tugas S3 gagal

Jika S3DistCp tidak dapat menyalin beberapa atau semua file yang ditentukan, maka perintah atau langkah klaster akan gagal dan mengembalikan kode kesalahan non-zero. Jika hal ini terjadi, S3DistCp tidak akan membersihkan sebagian file yang disalin. Anda harus menghapusnya secara manual.

Sebagian file yang disalin disimpan ketmp direktori HDFS di sub-direktori dengan pengenal unik dariDistCp tugas S3. Anda dapat menemukan ID ini dalam output standar tugas.

Sebagai contoh, untukDistCp tugas S3 dengan ID4b1c37bb-91af-4391-aaf8-46a6067085a6, Anda dapat terhubung ke simpul utama klaster dan menjalankan perintah berikut untuk melihat file output yang terkait dengan tugas tersebut.

hdfs dfs -ls /tmp/4b1c37bb-91af-4391-aaf8-46a6067085a6/output

Perintah ini akan menghasilkan daftar file yang serupa dengan berikut ini:

Found 8 items -rw-r--r-- 1 hadoop hadoop 0 2018-12-10 06:03 /tmp/4b1c37bb-91af-4391-aaf8-46a6067085a6/output/_SUCCESS -rw-r--r-- 1 hadoop hadoop 0 2018-12-10 06:02 /tmp/4b1c37bb-91af-4391-aaf8-46a6067085a6/output/part-r-00000 -rw-r--r-- 1 hadoop hadoop 0 2018-12-10 06:02 /tmp/4b1c37bb-91af-4391-aaf8-46a6067085a6/output/part-r-00001 -rw-r--r-- 1 hadoop hadoop 0 2018-12-10 06:02 /tmp/4b1c37bb-91af-4391-aaf8-46a6067085a6/output/part-r-00002 -rw-r--r-- 1 hadoop hadoop 0 2018-12-10 06:03 /tmp/4b1c37bb-91af-4391-aaf8-46a6067085a6/output/part-r-00003 -rw-r--r-- 1 hadoop hadoop 0 2018-12-10 06:03 /tmp/4b1c37bb-91af-4391-aaf8-46a6067085a6/output/part-r-00004 -rw-r--r-- 1 hadoop hadoop 0 2018-12-10 06:03 /tmp/4b1c37bb-91af-4391-aaf8-46a6067085a6/output/part-r-00005 -rw-r--r-- 1 hadoop hadoop 0 2018-12-10 06:03 /tmp/4b1c37bb-91af-4391-aaf8-46a6067085a6/output/part-r-00006

Anda kemudian dapat menjalankan perintah berikut untuk menghapus direktori dan semua isinya.

hdfs dfs rm -rf /tmp/4b1c37bb-91af-4391-aaf8-46a6067085a6