アクティビティ - AWS Data Pipeline

アクティビティ

AWS Data Pipeline では、アクティビティは実行する作業を定義するパイプラインコンポーネントです。​AWS Data Pipeline には、ある場所から別の場所へのデータの移動、Hive クエリの実行など、一般的なシナリオに対応するパッケージ済みのアクティビティがいくつか用意されています。アクティビティは拡張可能であるため、独自のカスタムスクリプトを実行して、無限の組み合わせをサポートできます。

AWS Data Pipeline は、次のタイプのアクティビティをサポートしています。

CopyActivity

ある場所から別の場所にデータをコピーします。

EmrActivity

Amazon EMR クラスターを実行します。

HiveActivity

Amazon EMR クラスターで Hive クエリを実行します。

HiveCopyActivity

高度なデータフィルタリングのサポートおよび S3DataNodeDynamoDBDataNode のサポートを使用して、Amazon EMR クラスターで Hive クエリを実行します。

PigActivity

Amazon EMR クラスターで Pig スクリプトを実行します。

RedshiftCopyActivity

Amazon Redshift テーブルとの間でデータをコピーします。

ShellCommandActivity

アクティビティとしてカスタム UNIX/Linux シェルコマンドを実行します。

SqlActivity

データベースに対する SQL クエリを実行します。

一部のアクティビティでは、データとデータベーステーブルのステージングについて特別なサポートが提供されています。詳細については、「パイプラインのアクティビティによるデータとテーブルのステージング」を参照してください。