設定聯網 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

設定聯網

大多數叢集使用 Amazon Virtual Private Cloud (Amazon VPC) 在虛擬網路中啟動。虛擬私人 VPC 是一個隔離的虛擬網路 AWS ,在您的 AWS 帳戶中邏輯上是隔離的。您可以設定私有 IP 地址範圍、子網路、路由表和網路閘道等方面。如需詳細資訊,請參閱 Amazon VPC 使用者指南

VPC 提供下列功能:

  • 處理敏感資料

    在 VPC 中啟動叢集與使用其他工具 (例如路由表和網路 ACL) 在私有網路中啟動叢集類似,以定義可存取網路的人員。如果您正在處理的是叢集中的敏感資料,您可能需要在 VPC 中啟動叢集所提供的其他存取控制。此外,您可以選擇在私有子網路中啟動資源,其中這些資源都沒有直接的網際網路連線。

  • 透過內部網路存取資源

    如果您的資料來源位於私人網路中,可能因為要傳輸的資料量或資料的敏感性質,將該資料上傳到 Amazon EMR 是不切實際或不 AWS 合適的。但您可以在 VPC 中啟動叢集,並透過 VPN 將資料中心連接到 VPC,讓叢集可透過內部網路存取資源。例如,如果您在資料中心中有一個 Oracle 資料庫,在透過 VPN 連接到該網路的 VPC 中啟動叢集可讓叢集存取 Oracle 資料庫。

公有和私有子網路

您可以同時在公有和私有 VPC 子網路中啟動 Amazon EMR 叢集。這表示您不需要網際網路連線即可執行 Amazon EMR 叢集;不過,您可能需要設定網路位址轉譯 (NAT) 和 VPN 閘道,才能存取位於 VPC 外部的服務或資源,例如在公司內部網路或公共 AWS 服務端點等。 AWS Key Management Service

重要

Amazon EMR 僅支援在發行版本 4.2 和更新版本中的私有子網路中啟動叢集。

如需 Amazon VPC 的詳細資訊,請參閱《Amazon VPC 使用者指南》https://docs.aws.amazon.com/vpc/latest/userguide/

了解 VPC 的更多資源

若要進一步了解 VPC 與子網路,請參閱下列主題。