Uso de una canalización con recursos en varias regiones

De forma predeterminada, los EmrCluster recursos Ec2Resource y se ejecutan en la misma región AWS Data Pipeline, pero AWS Data Pipeline permiten organizar los flujos de datos en varias regiones, por ejemplo, ejecutar los recursos en una región para consolidar los datos de entrada de otra región. Al permitir que los recursos se ejecuten una región determinada, también dispone de flexibilidad para coubicar los recursos con sus conjuntos de datos dependientes y maximizar el rendimiento, reduciendo las latencias y evitando cargos por transferencia de datos entre regiones. Puede configurar los recursos para que se ejecuten en una región diferente a AWS Data Pipeline la que utilice el region campo en Ec2Resource yEmrCluster.

El siguiente archivo JSON de canalización de ejemplo muestra cómo ejecutar un recurso EmrCluster en la región Europa (Irlanda), suponiendo que exista en la misma región una gran cantidad de datos para el clúster en el que se va a trabajar. En este ejemplo, la única diferencia con una canalización típica es que el valor del campo region de EmrCluster está establecido en eu-west-1.


{
  "objects": [
    {
      "id": "Hourly",
      "type": "Schedule",
      "startDateTime": "2014-11-19T07:48:00",
      "endDateTime": "2014-11-21T07:48:00",
      "period": "1 hours"
    },
    {
      "id": "MyCluster",
      "type": "EmrCluster",
      "masterInstanceType": "m3.medium",
      "region": "eu-west-1",
      "schedule": {
        "ref": "Hourly"
      }
    },
    {
      "id": "MyEmrActivity",
      "type": "EmrActivity",
      "schedule": {
        "ref": "Hourly"
      },
      "runsOn": {
        "ref": "MyCluster"
      },
      "step": "/home/hadoop/contrib/streaming/hadoop-streaming.jar,-input,s3n://elasticmapreduce/samples/wordcount/input,-output,s3://eu-west-1-bucket/wordcount/output/#{@scheduledStartTime},-mapper,s3n://elasticmapreduce/samples/wordcount/wordSplitter.py,-reducer,aggregate"
    }
  ]
}

En la tabla siguiente se muestran las regiones que puede elegir y los códigos de región asociados que debe utilizar en el campo region.

nota

La siguiente lista incluye regiones en las que se AWS Data Pipeline pueden organizar flujos de trabajo y lanzar Amazon EMR o los recursos de Amazon EC2 . AWS Data Pipeline es posible que no sea compatible en estas regiones. Para obtener información sobre las regiones en las que AWS Data Pipeline se admite, consulte Regiones y puntos de enlace de AWS.

Nombre de la región	Código de región
Este de EE. UU. (Norte de Virginia)	us-east-1
Este de EE. UU. (Ohio)	us-east-2
Oeste de EE. UU. (Norte de California)	us-west-1
Oeste de EE. UU. (Oregón)	us-west-2
Canadá (centro)	ca-central-1
Europa (Irlanda)	eu-west-1
Europa (Londres)	eu-west-2
Europa (Fráncfort)	eu-central-1
Asia-Pacífico (Singapur)	ap-southeast-1
Asia-Pacífico (Sídney)	ap-southeast-2
Asia-Pacífico (Bombay)	ap-south-1
Asia-Pacífico (Tokio)	ap-northeast-1
Asia-Pacífico (Seúl)	ap-northeast-2
América del Sur (São Paulo)	sa-east-1

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Datos y tablas transitorios con actividades

Errores en cascada y repeticiones de ejecuciones