ステップ 2: Amazon EMR クラスターを起動します
このステップでは、Amazon EMR クラスターを設定して起動します。このクラスターには、Hive および DynamoDB 用のストレージハンドラーが、既にインストールされています。
Amazon EMR コンソール (https://console.aws.amazon.com/emr
) を開きます。 -
[クラスターの作成] を選択します。
-
[Create Cluster - Quick Options] (クラスターの作成 – クイックオプション) ページで、以下を実行します。
-
[Cluster name] (クラスター名) にクラスターの名前を入力します (例:
My EMR cluster
など)。 -
[EC2 key pair] (EC2 キーペア) で、先に作成してあるキーペアを選択します。
その他の設定はデフォルト値のままにしておきます。
-
-
[クラスターを作成] を選択します。
クラスターを起動するには数分間かかります。このプロセスの進捗状況は、Amazon EMR コンソールの [Cluster Details] (クラスターの詳細) ページで確認できます。
ステータスが Waiting
に変わると、クラスターは使用可能状態になっています。
クラスターのログファイルと Amazon S3
Amazon EMR クラスターは、クラスターのステータスやデバッグに関する情報が記載されたログファイルを生成します。[Create Cluster - Quick Options (クラスターの作成-クイックオプション)] のデフォルト設定には、Amazon EMR でのログ記録に関する設定が含まれています。
まだ Amazon S3 バケットが存在しない場合は、AWS Management Console マネジメントコンソールにより作成されます。このバケットの名前は aws-logs-
となります。ここで、account-id
-region
は AWS アカウント番号で、account-id
は、クラスターを起動したリージョン (例えば region
aws-logs-123456789012-us-west-2
) です。
注記
Amazon S3 コンソールを使用して、このログファイルを表示できます。詳細については、「Amazon EMR 管理ガイド」の「ログファイルを表示する」を参照してください。
このバケットは、ログ記録以外の目的でも使用できます。例えば、バケットを Hive スクリプトを保存する場所として使用することや、Amazon DynamoDB から Amazon S3 にデータをエクスポートする際の送信先として使用することが可能です。