为您的 Amazon EMR 集群选择一个 AWS 区域 - Amazon EMR

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

为您的 Amazon EMR 集群选择一个 AWS 区域

Amazon Web Services 在全球范围内的数据中心的服务器上运行。数据中心按地理区域进行管理。启动 Amazon EMR 集群时,必须指定一个区域。您可以选择一个区域,以便减少延迟、尽可能降低成本或满足法规要求。有关 Amazon 支持的区域和终端节点列表EMR,请参阅中的区域和终端节点Amazon Web Services 一般参考

为了获得最佳性能,您应在与您的数据相同的区域启动集群。例如,如果存储您的输入数据的 Amazon S3 存储桶位于美国西部(俄勒冈州)区域,那么您应在美国西部(俄勒冈州)区域启动集群,以避免缴纳跨区域数据传输费。如果您使用 Amazon S3 存储桶接收集群输出,那么也应该在美国西部(俄勒冈州)区域创建该集群输出。

如果您计划将 Amazon EC2 密钥对与集群关联(用于登录SSH主节点所必需的),则必须在与集群相同的区域中创建密钥对。同样,Amazon EMR 为管理集群而创建的安全组是在与集群相同的区域中创建的。

如果您 AWS 账户 在 2017 年 5 月 17 日当天或之后注册的,则访问资源时的默认区域为美国东部(俄亥俄州)(us-east-2);对于较旧的账户,默认区域 AWS Management Console 是美国西部(俄勒冈)(us-west-2) 或美国东部(弗吉尼亚北部)(us-east-1)。有关更多信息,请参阅区域和端点

某些 AWS 功能仅在有限的地区可用。例如,集群计算实例仅在美国东部(弗吉尼亚州北部)区域可用,而亚太地区(悉尼)区域仅支持 Hadoop 1.0.3 及更高版本。当您选择一个区域时,请核实该区域是否支持您想要使用的功能。

为了获得最佳性能,请将要用于集群的所有 AWS 资源使用相同的区域。下表列出了区域名称和服务的映射关系。有关 Amazon EMR 区域的列表,请参阅中的AWS 区域 和终端节点Amazon Web Services 一般参考

使用控制台选择区域

默认区域显示在导航栏上账户信息的左侧。要在新旧控制台中切换区域,请选择“区域”下拉菜单并选择一个新选项。

使用指定区域 AWS CLI

AWS CLI 使用aws configure命令或AWS_DEFAULT_REGION环境变量在中指定默认区域。有关更多信息,请参阅AWS Command Line Interface 用户指南》中的配置 AWS 区域

选择一个带SDK或的区域 API

要使用选择区域SDK,请将您的应用程序配置为使用该区域的终端节点。如果您使用创建客户端应用程序 AWS SDK,则可以通过调用来更改客户端终端节点setEndpoint,如以下示例所示:

client.setEndpoint("elasticmapreduce.us-west-2.amazonaws.com");

在您的应用程序通过设置终端节点指定区域后,您可以为集群的EC2实例设置可用区。可用区是专用于隔离其他可用区内故障的区分位置,可向相同区域中的其他可用区提供低延迟的便宜网络连接。一个区域包含一个或多个可用区。为了优化性能和降低延迟,所有资源应与使用它们的集群位于同一可用区。