設定主VPC機叢集 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

設定主VPC機叢集

在中啟動叢集之前VPC,您必須先建立VPC和子網路。對於公有子網路,您必須建立網際網路閘道並將它連接到子網路。下列指示說明如何建立VPC能夠託管 Amazon EMR 叢集的功能。

若要為 Amazon EMR 叢集建立VPC具有子網路的步驟
  1. 在打開 Amazon VPC 控制台https://console.aws.amazon.com/vpc/

  2. 在頁面的右上角,選擇 AWS 區域為您的VPC.

  3. 選擇 [建立] VPC。

  4. VPC設定頁面上,選擇VPC其項目。

  5. 在「自動產生名稱標籤」下,啟用「自動產生」並輸入您的名稱。VPC這可協助您在建立 Amazon VPC 主控台後識別子網路VPC和子網路。

  6. IPv4CIDR區塊欄位中,輸入私有 IP 位址空間以確保正確的DNS主機名稱解析;否則,您可能會遇VPC到 Amazon EMR 叢集失敗的情況。這包括以下 IP 地址範圍:

    • 10.0.0.0 - 10.255.255.255

    • 172.16.0.0 - 172.31.255.255

    • 192.168.0.0 - 192.168.255.255

  7. 可用區域數目 (AZs) 下,選擇要在其中啟動子網路的可用區域數目。

  8. 公用子網路數目下,選擇要新增至您VPC的. 如果叢集使用的資料可在網際網路上使用 (例如,在 Amazon S3 或 Amazon 中RDS),您只需要使用公有子網路,而不需要新增私有子網路。

  9. 私人子網路的數目下,選擇您要新增至您的私人子網路的數目。VPC如果應用程式的資料儲存在您自己的網路中 (例如,在 Oracle 資料庫中),請選取一或多個。對於私有子網路VPC中的,所有 Amazon EC2 執行個體至少必須具有EMR透過 elastic network interface 到 Amazon 的路由。在主控台中,我們將會自動為您設定。

  10. NAT閘道下,選擇性地選擇新增NAT閘道。只有當您具有需要與網際網路通訊的私有子網路時,才需要使用這些閘道。

  11. VPC端點下,選擇性地選擇將 Amazon S3 的端點新增到您的子網路。

  12. 確認已勾選 [啟用DNS主機名稱] 和 [啟用DNS解析度]。如需詳細資訊,請參閱DNS搭配 VPC.

  13. 選擇 [建立] VPC。

  14. 狀態視窗會顯示進行中的工作。工作完成時,選擇「檢視」VPC 以瀏覽至「的」VPCs 頁面,此頁面會顯示您的預設值VPC和VPC您剛建立的頁面。您建立的VPC是非預設值VPC,因此「預設VPC」欄會顯示「」。

  15. 如果要將您的VPC與不包含網域名稱的項DNS目產生關聯,請導覽至選DHCP項集,選擇「建立DHCP選項集」,然後省略網域名稱。建立選項集後,導覽至新選項集VPC,在「動作」功能表下DHCP選擇「編輯選項集」,然後選取新的選項集。建立DNS選項集之後,您就無法使用主控台編輯網域名稱。

    這是 Hadoop 和相關應用程式的最佳作法,以確保解析節點的完整網域名稱 (FQDN)。若要確保適當的DNS解析度,請配置包含參數設定為下列值的DHCP選項集的選項集:VPC

    • domain-name (domain-name) = ec2.internal

      如果您的區域是美國東部 (維吉尼亞北部),請使用 ec2.internal。對於其他區域,請使用 region-name.compute.internal。 如需中的範例us-west-2,請使用us-west-2.compute.internal。對於 AWS GovCloud (美國西部) 區域,使用us-gov-west-1.compute.internal

    • domain-name-servers = AmazonProvidedDNS

    如需詳細資訊,請參閱 Amazon VPC 使用者指南中的DHCP選項集

  16. 建立之VPC後,移至「子網路」頁面,並記下其中一個新子網路的子網路識別碼。VPC當您將 Amazon EMR 叢集啟動到VPC.