Format apa yang dapat EMR dikembalikan Amazon? - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Format apa yang dapat EMR dikembalikan Amazon?

Format output default untuk klaster adalah teks dengan kunci, pasangan nilai yang ditulis ke baris individual dari file teks. Ini adalah format output yang paling umum digunakan.

Jika data output Anda harus ditulis dalam format selain file teks default, Anda dapat menggunakan OutputFormat antarmuka Hadoop untuk menentukan jenis output lainnya. Anda bahkan dapat membuat subkelas dari kelas FileOutputFormat untuk menangani tipe data khusus. Untuk informasi lebih lanjut, lihat http://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapred/ OutputFormat .html.

Jika Anda meluncurkan cluster Hive, Anda dapat menggunakan serializer/deserializer (SerDe) untuk mengeluarkan data dari format tertentu. HDFS Untuk informasi lebih lanjut, lihat https://cwiki.apache.org/confluence/display/Hive/ SerDe.