出力場所を構成する - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

出力場所を構成する

Amazon EMR クラスターの最も一般的な出力形式は、圧縮されているか、圧縮されていないテキストファイルです。通常、これらは Amazon S3 バケットに書き込まれます。このバケットは、クラスターを起動する前に作成しておく必要があります。クラスターの起動時に、出力場所として S3 バケットを指定します。

詳細については、以下のトピックを参照してください。

Amazon S3 バケットの作成と設定

Amazon EMR (Amazon EMR) は、Amazon S3 を使用して、入力データ、ログファイル、および出力データを保存します。Amazon S3 は、これらのストレージロケーションをバケット。バケットには、Amazon S3 と DNS の要件に従って一定の制限と上限があります。詳細については、「」を参照してください。バケットの制約と制限Amazon Simple Storage Service 開発者ガイド

Amazon S3 バケットを作成するには、「」の手順に従います。バケットの作成[] ページで、Amazon Simple Storage Service 開発者ガイド

注記

で [ログ] を有効にする場合バケットの作成ウィザードでは、バケットアクセスログのみが有効になり、クラスターログは有効にはなりません。

注記

リージョン固有のバケット指定の詳細については、バケットとリージョンAmazon Simple Storage Service 開発者ガイドおよびで使用可能なリージョンエンドポイントAWSSDK

バケットを作成すると、バケットに適切なアクセス権限を設定できます。通常、お客様自身(オーナー)に読み書きのアクセス権を付与します。従うことを強くお勧めしますAmazon S3 のセキュリティベストプラクティスバケットを設定するときに使用します。

必要な Amazon S3 バケットは、クラスターを作成する前に存在していなければなりません。クラスターで参照される必要なスクリプトまたはデータはすべて、Amazon S3 にアップロードする必要があります。次の表では、サンプルデータ、スクリプト、およびログファイルの場所について説明しています。

情報 Amazon S3 の場所の例
スクリプトまたはプログラム s3://DOC-EXAMPLE-BUCKET1/script/MapperScript.py
ログファイル s3://DOC-EXAMPLE-BUCKET1/logs
入力データ s3://DOC-EXAMPLE-BUCKET1/input
出力データ s3://DOC-EXAMPLE-BUCKET1/output