活動 - AWS Data Pipeline

AWS Data Pipeline 不再提供給新客戶。的現有客戶 AWS Data Pipeline 可繼續正常使用此服務。進一步了解

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

活動

在中 AWS Data Pipeline,活動是定義要執行之工作的管線元件。 AWS Data Pipeline 提供數個可容納常見案例的預先封裝活動,例如將資料從一個位置移至另一個位置、執行 Hive 查詢等。活動是可擴展的,因此您可以執行自己的自訂指令碼來支援無限的組合。

AWS Data Pipeline 支援下列類型的活動:

CopyActivity

將資料從一個位置複製到另一個。

EmrActivity

執行 Amazon EMR 叢集。

HiveActivity

在 Amazon EMR 叢集上執行蜂巢查詢。

HiveCopyActivity

在 Amazon EMR 叢集上執行 Hive 查詢,並支援和的進階資料篩選S3 DataNodeD ynamoDBData 節點支援。

PigActivity

在 Amazon EMR 集群上運行豬腳本。

RedshiftCopyActivity

將資料複製到和從 Amazon Redshift 表格複製資料。

ShellCommandActivity

執行自訂 UNIX/Linux shell 命令做為活動。

SqlActivity

在資料庫上執行 SQL 查詢。

某些活動具有預備資料和資料庫資料表的特殊支援。如需詳細資訊,請參閱 使用管道活動預備資料和資料表