Amazon EMR
管理ガイド

ネットワーキングを設定する

クラスターに選択できる 2 つのネットワークプラットフォームオプションがあります: EC2-Classic または EC2-VPC です。EC2-Classic では、お客様のインスタンスは他のユーザー様と共有する単一のフラットネットワーク内で稼働します。EC2-Classic は、特定のリージョンの特定のアカウントでのみ利用できます。詳細については、Linux インスタンス用 Amazon EC2 ユーザーガイドの「Amazon EC2 および Amazon VPC」を参照してください。EC2-VPC で、クラスターは Amazon Virtual Private Cloud (Amazon VPC) を使用し、EC2 インスタンスは、AWS アカウント内に論理的に分離されている VPC 内で実行されます。Amazon VPC を使用すると、AWS 内の分離した領域である仮想プライベートクラウド (VPC) をプロビジョニングして、仮想ネットワークを設定し、プライベート IP アドレスの範囲、サブネット、ルーティングテーブル、ネットワークゲートウェイなどの側面を制御できます。

VPCは、次の機能を提供します。

  • 機密データを処理する

    VPC 内でクラスターを起動することは、ルーティングテーブルや、ネットワークにアクセスできるユーザーを定義するネットワーク ACL などの追加的なツールを備えたプライベートネットワーク内でクラスターを起動することに似ています。クラスターで機密データを処理する場合は、VPC 内でクラスターを起動することで得られる追加のアクセスコントロールが必要になる可能性があります。さらに、これらのリソースのいずれにも直接的なインターネット接続を持たないプライベートサブネット内でリソースを起動することもできます。

  • 内部ネットワーク上のリソースにアクセスする

    データソースがプライベートネットワーク内に存在する場合、そのデータを Amazon EMR にインポートするために AWS にアップロードすることは、転送するデータの量またはデータの機密性の理由で、実用的でない、または望ましくないことがあります。代わりにクラスターを VPC 内で起動し、VPN 接続によってデータセンターと VPC を接続すると、クラスターは内部ネットワーク上のリソースにアクセスすることができます。たとえば、データセンターに Oracle データベースがある場合、クラスターを VPN でネットワークに接続した VPC 内で起動すると、クラスターはその Oracle データベースにアクセスできます。

パブリックサブネットとプライベートサブネット

パブリックおよびプライベート VPC サブネットの両方で EMR クラスターを起動できます。これは、EMR クラスターを実行するために、インターネット接続が必要ないことを意味します。ただし、たとえば企業イントラネット内、または AWS Key Management Service などのパブリック AWS サービスエンドポイントなど、VPC の外側にあるサービスまたはリソースにアクセスするために、サービスネットワークアドレス変換 (NAT) および VPN ゲートウェイを構成しなければならない場合があります。

重要

Amazon EMR は、リリース 4.2 以降のプライベートサブネットでのクラスターの起動のみをサポートします。

Amazon VPC の詳細については、Amazon VPC ユーザーガイドを参照してください。

VPC に関するその他のリソース

以下のトピックでは、VPC およびサブネットの詳細について説明します。

このページの内容: