利用多个区域中的资源使用管道

默认情况下，Ec2Resource和EmrCluster资源与在同一区域运行 AWS Data Pipeline，但 AWS Data Pipeline 支持跨多个区域协调数据流的功能，例如在一个区域运行资源来整合来自另一个区域的输入数据。通过允许资源在指定区域中运行，您还具备了灵活性，可以将资源与其从属数据集放置在一起，通过减少延迟来最大化性能，同时避免跨区域的数据传输费用。您可以将资源配置为在不同的区域运行，而不是 AWS Data Pipeline 使用Ec2Resource和上的region字段EmrCluster。

以下示例管道 JSON 文件显示了如何在欧洲地区（爱尔兰）运行 EmrCluster 资源，假定集群要处理的大量数据位于相同区域上。在本示例中，与典型管道的唯一的区别是 EmrCluster 将 region 字段值设置为 eu-west-1。


{
  "objects": [
    {
      "id": "Hourly",
      "type": "Schedule",
      "startDateTime": "2014-11-19T07:48:00",
      "endDateTime": "2014-11-21T07:48:00",
      "period": "1 hours"
    },
    {
      "id": "MyCluster",
      "type": "EmrCluster",
      "masterInstanceType": "m3.medium",
      "region": "eu-west-1",
      "schedule": {
        "ref": "Hourly"
      }
    },
    {
      "id": "MyEmrActivity",
      "type": "EmrActivity",
      "schedule": {
        "ref": "Hourly"
      },
      "runsOn": {
        "ref": "MyCluster"
      },
      "step": "/home/hadoop/contrib/streaming/hadoop-streaming.jar,-input,s3n://elasticmapreduce/samples/wordcount/input,-output,s3://eu-west-1-bucket/wordcount/output/#{@scheduledStartTime},-mapper,s3n://elasticmapreduce/samples/wordcount/wordSplitter.py,-reducer,aggregate"
    }
  ]
}

下表列出了您可以在 region 字段中选择的区域以及使用的关联区域代码：

注意

以下列表包括 AWS Data Pipeline 可以在其中协调工作流程和启动 Amazon EMR 或 Amazon 资源的区域。 EC2 AWS Data Pipeline 这些地区可能不支持。有关支持区域的信息， AWS Data Pipeline 请参阅 AWS 区域和终端节点。

区域名称	区域代码
美国东部（弗吉尼亚州北部）	us-east-1
美国东部（俄亥俄州）	us-east-2
美国西部 (加利福尼亚北部)	us-west-1
美国西部（俄勒冈州）	us-west-2
加拿大（中部）	ca-central-1
欧洲地区（爱尔兰）	eu-west-1
欧洲地区（伦敦）	eu-west-2
欧洲（法兰克福）	eu-central-1
亚太地区（新加坡）	ap-southeast-1
亚太地区（悉尼）	ap-southeast-2
亚太地区（孟买）	ap-south-1
亚太地区（东京）	ap-northeast-1
亚太地区 (首尔)	ap-northeast-2
南美洲（圣保罗）	sa-east-1

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

将数据和表与活动一起暂存

级联故障和重新运行