Amazon EMR クラスターの AWS リージョンを選択する
Amazon Web Services は、世界中のデータセンターにあるサーバーで実行されています。データセンターは、地理的リージョン別に整理されています。Amazon EMR クラスターを起動するときは、リージョンを指定する必要があります。レイテンシーを削減し、コストを最小限に抑えて規制用件に対応できるリージョンを選ぶとよいでしょう。Amazon EMR でサポートされているリージョンとエンドポイントの一覧については、「Amazon Web Services 全般のリファレンス」の「リージョンとエンドポイント」を参照してください。
最高のパフォーマンスのため、クラスターはデータと同じリージョンで起動する必要があります。例えば、入力データを格納している Simple Storage Service (Amazon S3) バケットが米国西部 (オレゴン) リージョンにある場合、リージョン内データ転送料を避けるため、米国西部 (オレゴン) リージョンでクラスターを起動する必要があります。Simple Storage Service (Amazon S3) バケットを使用して、クラスターの出力を受け取る場合、それも米国西部 (オレゴン) リージョンで作成する必要があります。
Amazon EC2 キーペアをクラスターと関連付ける予定がある場合 (SSH を使用して、マスターノードにログオンする場合に必要)、キーペアをクラスターと同じリージョンで作成する必要があります。同様に、Amazon EMR がクラスターを管理するために作成するセキュリティグループは、クラスターと同じリージョンに作成します。
2017 年 5 月 17 日以降に AWS アカウントにサインアップした場合、AWS Management Consoleからリソースにアクセスしたときのデフォルトのリージョンは米国東部 (オハイオ) (us-east-2) です。古いアカウントの場合、デフォルトのリージョンは、米国西部 (オレゴン) (us-west-2) または米国東部 (バージニア北部) (us-east-1) です。詳細については、「リージョンとエンドポイント」を参照してください。
一部の AWS 機能は限定されたリージョンでのみ使用できます。例えば、クラスターコンピューティングインスタンスは米国東部 (バージニア北部) リージョンでのみ使用でき、アジアパシフィック (シドニー) リージョンでは Hadoop 1.0.3 以降のみサポートされます。リージョンを選択する場合は、リージョンで使用したい機能がサポートされていることを確認してください。
最高のパフォーマンスを実現するため、クラスターで使用されるすべての AWS リソースに同じリージョンを使用します。次の表に、サービス間でリージョン名をマッピングします。Amazon EMR リージョンのリストについては、「Amazon Web Services 全般のリファレンス」の「AWS リージョンとエンドポイント」を参照してください。
コンソールでリージョンを選択する
デフォルトのリージョンは、ナビゲーションバーのアカウント情報の左側に表示されます。新しいコンソールと古いコンソールの両方でリージョンを切り替えるには、[リージョン] ドロップダウンメニューを選択し、新しいオプションを選択します。
AWS CLI でリージョンを指定します
aws
configure コマンドまたは AWS_DEFAULT_REGION
環境変数を使用して、AWS CLI でデフォルトのリージョンを指定します。詳細については、「AWS Command Line Interface ユーザーガイドの「AWS リージョンの設定」を参照してください。
SDK または API でリージョンを選択する
SDK を使用してリージョンを選択するには、リージョンのエンドポイントを使用するようにアプリケーションを設定します。AWS SDK を使用してクライアントアプリケーションを作成している場合、以下の例のように setEndpoint
を呼び出すことによってクライアントのエンドポイントを変更できます。
client.setEndpoint("elasticmapreduce.us-west-2.amazonaws.com");
アプリケーションでエンドポイントを設定して、リージョンを指定したら、クラスターの EC2 インスタンスのアベイラビリティーゾーンを設定できます。アベイラビリティーゾーンはそれぞれが地理的に独立しており、他のゾーンの影響は受けません。また、同じリージョン内の他のアベイラビリティーゾーンへのネットワーク接続が低コストで、レイテンシーも短くなります。リージョンには 1 つまたは複数のアベイラビリティーゾーンが含まれます。パフォーマンスを最適化し、レイテンシーを低減するには、すべてのリソースを、それらを使用するクラスターと同じアベイラビリティーゾーンに置く必要があります。