使用 Step Functions 啟動 AWS Glue DataBrew 任務 - AWS Step Functions

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 Step Functions 啟動 AWS Glue DataBrew 任務

了解如何使用 DataBrew 整合,透過 Step Functions 將資料清理和資料標準化步驟新增至分析和機器學習工作流程。

若要了解如何在 Step Functions 中整合 AWS 服務,請參閱 整合 服務將參數傳遞至 Step Functions API中的服務

下列包含啟動請求回應 DataBrew任務Task的狀態。

"DataBrew StartJobRun": { "Type": "Task", "Resource": "arn:aws:states:::databrew:startJobRun", "Parameters": { "Name": "sample-proj-job-1" }, "Next": "NEXT_STATE" },

下列包含啟動同步 DataBrew 任務Task的狀態。

"DataBrew StartJobRun": { "Type": "Task", "Resource": "arn:aws:states:::databrew:startJobRun.sync", "Parameters": { "Name": "sample-proj-job-1" }, "Next": "NEXT_STATE" },
中的參數 Step Functions 以 表示 PascalCase

即使原生服務API位於 中camelCase,例如 API 動作 startSyncExecution,您也可以在 中指定參數 PascalCase,例如:StateMachineArn

支援的 DataBrew APIs

IAM 用於呼叫 的政策 DataBrew

下列範例範本顯示 如何根據您狀態機器定義中的資源 AWS Step Functions 產生IAM政策。如需詳細資訊,請參閱 Step Functions 式如何為整合式服務產生IAM原則探索 Step Functions 中的服務整合模式

Run a Job (.sync)
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "databrew:startJobRun", "databrew:listJobRuns", "databrew:stopJobRun" ], "Resource": [ "arn:aws:databrew:{{region}}:{{accountId}}:job/*" ] } ] }
Request Response
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "databrew:startJobRun" ], "Resource": [ "arn:aws:databrew:{{region}}:{{accountId}}:job/*" ] } ] }