Amazon EMR
管理ガイド

クラスターハードウェアとネットワークを構成する

EMR クラスターの作成時における重要な考慮事項は、Amazon EC2 インスタンスおよびネットワークオプションを構成する方法です。EMR クラスター内の EC2 インスタンスは、ノードタイプに分類されます。マスターノードコアノード、およびタスクノードの 3 つがあります。各ノードタイプは、クラスター上にインストールする分散アプリケーションにより定義される一連のロールを実行します。たとえば、Hadoop MapReduce または Spark ジョブの実行中に、コアノートとタスクノード上のコンポーネントはデータを処理し、出力を Amazon S3 または HDFS に転送し、ステータスメタデータをマスターノードに提供します。単一ノードクラスターの場合、すべてのコンポーネントはマスターノード上で実行されます。

各ノードタイプをホストする EC2 インスタンスの集合は、インスタンスフリートまたはユニフォームインスタンスグループと呼ばれます。インスタンスフリートまたはユニフォームインスタンスグループの構成は、クラスターの作成時に選択します。これはすべてのノードタイプに適用され、後から変更できません。

クラスターの作成時に、クラスターのパフォーマンスプロファイルを最終的に決定する選択を行います。この章では、これらのオプションを詳しく説明したうえで、ベストプラクティスとガイドラインによって総括します。

注記

インスタンスフリート設定は、5.0.0 および 5.0.3 を除く Amazon EMR バージョン 4.8.0 以降でのみ使用できます。