步驟 8:使用藍圖建立工作流程 - AWS Lake Formation

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

步驟 8:使用藍圖建立工作流程

AWS Glue工作 AWS Lake Formation 流程會產生探索資料並將資料擷取到資料湖中的工作、編目程式和觸發器。您可以根據其中一個預先定義的 Lake Formation 藍圖來建立工作流程。

  1. 在「Lake Formation」主控台的導覽窗格中,選擇「圖」,然後選擇「使用藍圖」。

  2. 在 [使用藍圖] 頁面的 [藍圖類型] 下,選擇 [資料庫快照集]。

  3. 在 [匯入來源] 下,對於 [資料庫連線],選擇您剛建立的連線datalake-tutorial,或選擇資料來源的現有連線。

  4. 對於來源資料路徑,請在表單<database>/<schema>/<table>中輸入要擷取資料的來源路徑。

    您可以用百分比 (%) 萬用字元取代結構描述或資料表。<database>對於支援結構描述的資料庫,請輸入<database>/<schema>/% 以符合<schema>中的所有表格。Oracle 資料庫和 MySQL 不支援路徑中的結構描述,而是輸入 <database>/%。如果是「Oracle 資料庫」,<database>則是系統識別碼 (SID)。

    例如,如果 Oracle 資料庫具有 orcl SID,請輸入orcl/%以符合 JDCB 連線中指定之使用者可存取的所有表格。

    重要

    此欄位會區分大小寫。

  5. 在「匯入目標」下,指定下列參數:

    目標資料庫 lakeformation_tutorial
    目標儲存位置 s3://<yourName>-datalake-tutorial
    資料格式 (選擇實木複合地板或 CSV)
  6. 針對匯入頻率,請選擇「視需求執行」。

  7. 在「匯入選項」下,指定下列參數:

    工作流程名 lakeformationjdbctest
    IAM 角色 LakeFormationWorkflowRole
    表前綴 jdbctest
    注意

    必須是小寫。

  8. 選擇 [建立],然後等待主控台回報工作流程已成功建立。

    提示

    您是否收到下列錯誤訊息?

    User: arn:aws:iam::<account-id>:user/<datalake_administrator_user> is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>:role/LakeFormationWorkflowRole...

    如果是這樣,請檢查您是否已<account-id>在資料湖管理員使用者的內嵌原則中取代為有效的 AWS 帳戶號碼。