クラスターに接続する - Amazon EMR

クラスターに接続する

Amazon EMR クラスターを実行するときに必要な作業は、多くの場合、データを分析するアプリケーションを実行し、Amazon S3 バケットからの出力を収集することのみです。また、クラスターの実行中にプライマリノードを操作することもできます。例えば、プライマリノードに接続することによって、インタラクティブなクエリの実行、ログファイルの確認、クラスターの問題のデバッグ、プライマリノードで実行される Ganglia などのアプリケーションを使用したパフォーマンスのモニタリングなどを実行できます。以降のセクションでは、プライマリノードに接続する手法について説明します。

EMR クラスターでは、プライマリノードは、タスクノードとコアノードとして実行される EC2 インスタンスを調整する Amazon EC2 インスタンスです。プライマリノードは、自身への接続に使用できるパブリック DNS 名を公開しています。デフォルトでは、Amazon EMR がプライマリノード、コアノード、タスクノードのセキュリティグループルールを作成し、これらがノードへのアクセス方法を決定します。

注記

プライマリノードには、クラスターの実行中にしか接続できません。クラスターが終了すると、プライマリノードとして動作している EC2 インスタンスも終了し、使用できなくなります。プライマリノードに接続するには、クラスターも認証する必要があります。Kerberos 認証を使用するか、クラスターを起動するときに Amazon EC2 キーペアのプライベートキーを指定できます。Kerberos の設定および接続の詳細については、「Amazon EMR での認証に Kerberos を使用する」を参照してください。コンソールからクラスターを起動するときは、[クラスターの作成] ページの [セキュリティとアクセス] セクションで Amazon EC2 キーペアのプライベートキーを指定します。

デフォルトでは、ElasticMapReduce-master セキュリティグループは、インバウンド SSH アクセスを許可しません。アクセスするソースからの SSH アクセス (TCP ポート 22) を許可する、インバウンドルールを追加する必要がある場合があります。セキュリティグループのルールの変更に関する詳細については、「Amazon EC2 Linux インスタンス用ユーザーガイド」の「セキュリティグループにルールを追加する」を参照してください。

重要

ElasticMapReduce-master セキュリティグループの他のルールは変更しないでください。これらのルールを変更すると、クラスターのオペレーションに悪影響を及ぼす可能性があります。