Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Welche Formate kann Amazon EMR zurückgeben?
Das Standardausgabeformat für einen Cluster ist Text mit Schlüssel-Wert-Paaren, die in einzelne Zeilen der Textdateien geschrieben werden. Dies ist das am häufigsten verwendete Ausgabeformat.
Wenn Ihre Ausgabedaten in einem anderen Format geschrieben werden müssen als Standardtextdateien, können Sie die Hadoop-Benutzeroberfläche OutputFormat
verwenden, um andere Ausgabetypen anzugeben. Sie können auch eine Unterklasse der FileOutputFormat
-Klasse für den Umgang mit benutzerdefinierten Datentypen verwenden. Weitere Informationen finden Sie unter http://hadoop.apache. org/docs/current/api/org/apache/hadoop/mapred/OutputFormat
Wenn Sie einen Hive-Cluster starten, können Sie einen Serializer/Deserializer (SerDe) verwenden, um Daten in ein bestimmtes Format auszugeben. HDFS Weitere Informationen finden Sie unter https://cwiki.apache. org/confluence/display/Hive/SerDe