Einen Ausgabespeicherort konfigurieren - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Einen Ausgabespeicherort konfigurieren

Das häufigste Ausgabeformat eines Amazon-EMR-Clusters sind Textdateien, und zwar entweder komprimiert oder nicht komprimiert. Diese Dateien werden in der Regel in einen Amazon-S3-Bucket geschrieben. Dieser Bucket muss erstellt werden, bevor Sie den Cluster starten. Sie geben den S3-Bucket als Ausgabespeicherort an, wenn Sie den Cluster starten.

Weitere Informationen finden Sie unter den folgenden Themen:

Erstellen und Konfigurieren eines Amazon S3-Buckets

Amazon EMR (Amazon EMR) verwendet Amazon S3 zum Speichern von Eingabedaten, Protokolldateien und Ausgabedaten. Amazon S3 bezeichnet diese Speicherorte als Buckets. Buckets haben in Übereinstimmung mit den Amazon-S3- und DNS-Anforderungen bestimmte Einschränkungen und Bedingungen. Weitere Informationen finden Sie unter Bucket-Einschränkungen und -Limits im Amazon Simple Storage Service-Entwicklerhandbuch.

Um einen Amazon-S3-Bucket zu erstellen, befolgen Sie die Anweisungen auf der Seite Bucket erstellen im Benutzerhandbuch zu Amazon Simple Storage Service.

Anmerkung

Wenn Sie im Assistenten Bucket erstellen die Protokollierung aktivieren, werden nur Bucket-Zugriffsprotokolle aktiviert und nicht Cluster-Protokolle.

Anmerkung

Weitere Informationen zur Angabe regionsspezifischer Buckets finden Sie unter Buckets and Regions im Amazon Simple Storage Service Developer Guide und Available Region Endpoints for the SDKs. AWS

Nachdem Sie Ihren Bucket erstellt haben, können Sie die entsprechenden Zugriffsberechtigungen hierzu einrichten. Hierbei sollten Sie sich selbst (als Eigentümer) Lese- und Schreibzugriff erteilen. Wir empfehlen Ihnen dringend, bei der Konfiguration Ihres Buckets die bewährten Sicherheitsmethoden für Amazon S3 zu befolgen.

Erforderliche Amazon-S3-Buckets müssen vorhanden sein, bevor Sie einen Cluster erstellen können. Sie müssen alle erforderlichen Skripts und Daten auf Amazon S3 hochladen, auf die im Cluster verwiesen wird. In der folgenden Tabelle werden Beispiele für Speicherorte für Daten, Skripts und Protokolldateien beschrieben.

Informationen Beispielspeicherort auf Amazon S3
Skript oder Programm s3://DOC-EXAMPLE-BUCKET1/script/MapperScript.py
Protokolldateien s3://DOC-EXAMPLE-BUCKET1/logs
Eingabedaten s3://DOC-EXAMPLE-BUCKET1/input
Ausgabedaten s3://DOC-EXAMPLE-BUCKET1/output