Verwenden einer Pipeline mit Ressourcen in mehreren Regionen

Standardmäßig werden die EmrCluster Ressourcen Ec2Resource und in derselben Region ausgeführt, AWS Data Pipeline unterstützen jedoch die Fähigkeit AWS Data Pipeline, Datenflüsse über mehrere Regionen hinweg zu orchestrieren, z. B. die Ausführung von Ressourcen in einer Region, die Eingabedaten aus einer anderen Region konsolidieren. Da Sie Ressourcen die Ausführung in einer bestimmten Region erlauben können, haben Sie auch die Flexibilität, Ressourcen zusammen mit ihren abhängigen Datensätzen in derselben Region anzusiedeln und die Leistung zu maximieren, indem Latenzen verringert und Kosten für regionsübergreifende Datenübertragungen vermieden werden. Sie können Ressourcen so konfigurieren, dass sie in einer anderen Region ausgeführt AWS Data Pipeline werden, als wenn Sie das region Feld für Ec2Resource und EmrCluster verwenden.

Die folgende Beispiel-Pipeline-JSON-Datei zeigt, wie eine EmrCluster Ressource in der Region Europa (Irland) ausgeführt wird, wobei davon ausgegangen wird, dass in derselben Region eine große Datenmenge vorhanden ist, an der der Cluster arbeiten kann. In diesem Beispiel ist der einzige Unterschied zu einer typischen Pipeline, dass der Wert des Feldes region für EmrCluster auf eu-west-1 eingestellt ist.


{
  "objects": [
    {
      "id": "Hourly",
      "type": "Schedule",
      "startDateTime": "2014-11-19T07:48:00",
      "endDateTime": "2014-11-21T07:48:00",
      "period": "1 hours"
    },
    {
      "id": "MyCluster",
      "type": "EmrCluster",
      "masterInstanceType": "m3.medium",
      "region": "eu-west-1",
      "schedule": {
        "ref": "Hourly"
      }
    },
    {
      "id": "MyEmrActivity",
      "type": "EmrActivity",
      "schedule": {
        "ref": "Hourly"
      },
      "runsOn": {
        "ref": "MyCluster"
      },
      "step": "/home/hadoop/contrib/streaming/hadoop-streaming.jar,-input,s3n://elasticmapreduce/samples/wordcount/input,-output,s3://eu-west-1-bucket/wordcount/output/#{@scheduledStartTime},-mapper,s3n://elasticmapreduce/samples/wordcount/wordSplitter.py,-reducer,aggregate"
    }
  ]
}

In der folgenden Tabelle werden die Regionen aufgelistet, die Sie auswählen können, sowie die im Feld region zu verwendenden zugehörigen Regionscodes.

Anmerkung

Die folgende Liste enthält Regionen, in denen Workflows orchestriert und Amazon EMR- oder EC2 Amazon-Ressourcen gestartet werden AWS Data Pipeline können. AWS Data Pipeline wird in diesen Regionen möglicherweise nicht unterstützt. Informationen zu Regionen, in denen dies unterstützt AWS Data Pipeline wird, finden Sie unter AWS-Regionen und Endpunkte.

Name der Region	Regionscode
USA Ost (Nord-Virginia)	us-east-1
USA Ost (Ohio)	us-east-2
USA West (Nordkalifornien)	us-west-1
USA West (Oregon)	us-west-2
Kanada (Zentral)	ca-central-1
Europa (Irland)	eu-west-1
Europa (London)	eu-west-2
Europa (Frankfurt)	eu-central-1
Asien-Pazifik (Singapur)	ap-southeast-1
Asien-Pazifik (Sydney)	ap-southeast-2
Asien-Pazifik (Mumbai)	ap-south-1
Asien-Pazifik (Tokio)	ap-northeast-1
Asien-Pazifik (Seoul)	ap-northeast-2
Südamerika (São Paulo)	sa-east-1

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Staging von Daten und Tabellen mit Aktivitäten

Cascading-Ausfälle und erneute Ausführungen