クイックオプションを使用したクラスターの起動 - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

クイックオプションを使用したクラスターの起動

Amazon EMR コンソールの [クラスターの作成 - クイックオプション] ページを使用して、単純なタスクや評価またはテスト用のクラスターを素早く作成できます。クイックオプションでは、クラスターソフトウェア、ネットワーク、セキュリティなどの設定オプションにデフォルト値を使用します。例えば、クイックオプションでクラスターを起動する場合、クラスターに Virtual Private Cloud (VPC) とサブネットを選択しません。代わりに、Amazon EMR は、選択したリージョン用にデフォルトの Amazon Virtual Private Cloud (Amazon VPC) のパブリックサブネットでクラスターをセットアップします。

クイックオプションを使用してクラスターを起動するには

  1. AWS Management Consoleにサインインし、https://console.aws.amazon.com/elasticmapreduce/ で Amazon EMR コンソールを開きます。

  2. [クラスター] を選択してから、[クラスターの作成] を選択して、[Quick Options] (クイックオプション) ページを開きます。

  3. [クラスターの作成 - クイックオプション] ページで、提供されたフィールドの値を入力または選択します。[Quick Option] (クイックオプション) フィールドの詳細については、「クイックオプションの概要」を参照してください。

  4. [クラスターの作成] を選択して、クラスターを起動し、クラスターのステータスページを開きます。

  5. クラスターのステータスページで、クラスター名の横にあるクラスターの [Status] (ステータス) を見つけます。ステータスは、クラスター作成プロセスに応じて [開始中][実行中][待機中] へと変化します。アップデートを受けるには、右側にある更新アイコンを選択するか、ブラウザを更新する必要があります。

ステータスが [待機中] に変わると、クラスターが起動して実行中になり、ステップと SSH 接続を受け入れる準備が整います。

クイックオプションの概要

次の表では、Amazon EMR コンソールで [クラスターの作成 - クイックオプション] を使用してクラスターを起動する際のフィールドとデフォルト値について説明します。

コンソールフィールド デフォルト値 説明
クラスター名 マイクラスター

クラスター名はオプションです。クラスターの記述名は一意である必要はありません。

ログ記録 選択済み

ログ記録が有効な場合、Amazon EMR により、指定された Simple Storage Service (Amazon S3) フォルダに詳細なログデータが書き込まれます。ログ記録は、クラスターの作成時にのみ有効にすることができます。後で設定を変更することはできません。[Quick Options] (クイックオプション) では、デフォルトの Simple Storage Service (Amazon S3) バケットを選択します。オプションで独自のバケットを指定できます。詳細については、「Amazon S3 にアーカイブされたログファイルを表示する」を参照してください。

S3 フォルダ elasticmapreduce/

このオプションでは、Amazon EMR がログデータを書き込む Simple Storage Service (Amazon S3) バケット内のフォルダへのパスを指定します。指定されたパス内のデフォルトのフォルダがバケットに存在しない場合、そのフォルダは Amazon EMR によって自動的に作成されます。フォルダ名を入力するか、Simple Storage Service (Amazon S3) フォルダを参照することで、別のフォルダを指定できます。

起動モード クラスター

このオプションでは、長時間稼働クラスターを起動するか、作成時に指定したステップを実行した後に終了するクラスターを起動するかを指定します

[クラスター] オプションを指定すると、クラスターはユーザーが終了するまで実行を続けます。これは、長時間稼働クラスターと呼ばれます。[ステップ実行] を選択した場合は、Amazon EMR によりステップを追加して設定するよう求められます。ステップを使用して作業をクラスターに送信できます。指定したステップの実行を終了したら、クラスターは自動的に終了します。詳細については、「ステップ実行後に継続または終了するようにクラスターを設定する」を参照してください。

[Release] (リリース) emr-5.36.0

このオプションは、クラスターの作成時に使用する Amazon EMR リリースバージョンを指定します。Amazon EMR リリースは、Amazon EMR がインストールするオープンソースのアプリケーションのバージョン (Hadoop、Hive など) を決定します。最新のリリースバージョンのラベルがデフォルトで選択されます。ソリューションとの互換性のためにオープンソースのアプリケーションの異なるバージョンが必要な場合は、以前の Amazon EMR リリースを選択できます。Amazon EMR の以前のリリースバージョンの使用時には、一部の Amazon EMR の機能とアプリケーションを使用できない場合があります。可能な限り、最新のリリースバージョンを使用することをお勧めします。各 Amazon EMR リリースバージョンの詳細については、「Amazon EMR リリース ガイド」を参照してください。

アプリケーション Core Hadoop

このオプションでは、クラスターにインストールする、ビッグデータエコシステムからのオープンソースのアプリケーションを指定します。[Quick Options] (クイックオプション) では、最も一般的なアプリケーションの組み合わせから選択できます。リストされていない追加のアプリケーションを含むアプリケーションの独自の組み合わせを選択するには、[詳細オプションに移動する] を選択します。各 Amazon EMR リリースバージョンで使用可能なアプリケーションとバージョンの詳細については、「Amazon EMR リリースガイド」を参照してください。

さらに、Amazon EMR でアプリケーションをインストールできない場合、またはすべてのクラスターインスタンスでカスタムアプリケーションをインストールする必要がある場合は、ブートストラップアクションを使用できます。詳細については、「追加のソフトウェアをインストールするためのブートストラップアクションの作成」を参照してください。[ステップ実行] を選択した場合、Amazon EMR はステップに必要なものに基づいてインストールするアプリケーションを選択します。

テーブルメタデータに AWS Glue Data Catalog を使用 無効 有効にすると、AWS Glue Data Catalog が外部 Hive メタストアとして指定されます。詳細については、「Hive のメタストアとしての AWS Glue Data Catalog の使用」を参照してください。
インスタンスタイプ m5.xlarge

このオプションでは、クラスターで実行されるインスタンスに対して Amazon EMR が初期化する Amazon EC2 インスタンスタイプを指定します。デフォルトのインスタンスの選択はリージョンによって異なり、一部のインスタンスタイプは一部のリージョンで利用できない場合があります。詳細については、「クラスターハードウェアとネットワークを設定する」を参照してください。

インスタンス数 3

このオプションでは、初期化する Amazon EC2 インスタンスの数を指定します。各インスタンスは、Amazon EMR クラスター内のノードに対応します。少なくとも 1 つのノード (マスターノード) が必要です。インスタンスタイプとインスタンス数を選択するためのガイダンスについては、「クラスターの設定のガイドラインとベストプラクティス」を参照してください。

Cluster scaling (クラスタースケーリング) 選択解除 選択すると、クラスタースケーリングで EMR マネージドスケーリングが有効になります。マネージドスケーリングは、ワークロードに基づいて、コアノードとタスクノードのインスタンス数を自動的に増減します。詳細については、「Amazon EMR での EMR マネージドスケーリングの使用」を参照してください。
Auto-termination (自動終了) Amazon EMR リリースバージョン 6.4.0 以降で有効になり、デフォルトのアイドル時間は 1 時間です。Amazon EMR の他のサポートされているバージョンでは、自動終了はデフォルトで無効になっています。 有効にすると、自動終了ポリシーをクラスターにアタッチできます。ポリシーでは、クラスターが自動的にシャットダウンするまでのアイドル時間を指定します。詳細については、「自動終了ポリシーを使用する」を参照してください。
EC2 キーペア オプションの選択

これにより、Secure Shell (SSH) 接続を経由してクラスター内のノードに接続するときに使用する Amazon EC2 キーペアを指定します。Amazon EC2 キーペアを作成して指定することを強くお勧めします。キーペアを選択しない場合、クラスターに接続してステップを送信したり、アプリケーションを操作したりできません。詳細については、「クラスターに接続する」を参照してください。接続するには、セキュリティグループにインバウンドルールを作成し、SSH 接続を許可する必要もあります。

アクセス許可 デフォルト

このオプションを使用して、クラスターが使用する AWS Identity and Access Management ロールを指定します。これらのロールにより、クラスターインスタンスで実行中の Amazon EMR とアプリケーションが他の AWS サービスとやり取りする必要があるアクセス許可を確認できます。[Custom (カスタム)] を選択して、独自のロールを指定できます。最初はデフォルトのロールを使用することをお勧めします。詳細については、「AWS のサービスおよびリソースへのアクセス許可を Amazon EMR に付与する IAM サービスロールの設定」を参照してください。

EMR ロール EMR_DefaultRole Amazon EMR がお客様の代わりに、Amazon EC2 などの他の AWS サービスを呼び出せるようにするサービスロール。詳細については、「Amazon EMR のサービスロール (EMR ロール)」を参照してください。
EC2 インスタンスプロファイル EMR_EC2_DefaultRole Amazon EMR によって起動される Amazon EC2 インスタンスから、Simple Storage Service (Amazon S3) や DynamoDB などの他の AWS サービスにアクセスを提供します。詳細については、「クラスター EC2 インスタンスのサービスロール (EC2 インスタンスプロファイル)」を参照してください。