So erhalten Sie Daten in Amazon EMR - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So erhalten Sie Daten in Amazon EMR

Amazon EMR bietet mehrere Möglichkeiten, Daten auf einen Cluster zu übertragen. Die gängigste Methode besteht darin, die Daten auf Amazon S3 hochzuladen und die integrierten Funktionen von Amazon EMR zu verwenden, um die Daten in Ihren Cluster zu laden. Sie können auch das Hadoop-Feature DistributedCache für den verteilten Cache verwenden, um Dateien von einem verteilten Dateisystem in das lokale Dateisystem zu übertragen. Die von Amazon bereitgestellte Implementierung von Hive EMR (Hive-Version 0.7.1.1 und höher) umfasst Funktionen, mit denen Sie Daten zwischen DynamoDB und einem Amazon-Cluster importieren und exportieren können. EMR Wenn Sie große Datenmengen On-Premises verarbeiten müssen, kann der AWS Direct Connect -Service nützlich sein.