在 AWS Glue 中註冊藍圖 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 AWS Glue 中註冊藍圖

AWS Glue 開發人員已編寫藍圖並將 ZIP 封存上傳到 Amazon Simple Storage Service (Amazon S3) 之後,AWS Glue 管理員必須註冊藍圖。註冊藍圖以讓其可供使用。

當您註冊藍圖時,AWS Glue 會將藍圖封存複製到保留的 Amazon S3 位置。然後,您可以從上傳位置刪除封存。

若要註冊藍圖,您需要具備包含上傳封存的 Amazon S3 位置的讀取許可。您也需要 AWS Identity and Access Management (IAM) 許可 glue:CreateBlueprint。如需必須註冊、檢視和維護藍圖的 AWS Glue 管理員的建議許可,請參閱 藍圖的 AWS Glue 管理員許可

您可以使用 AWS Glue 主控台、AWS Glue API,或 AWS Command Line Interface (AWS CLI) 註冊藍圖。

註冊藍圖 (主控台)
  1. 確保您對 Amazon S3 中的藍圖 ZIP 封存具有讀取許可 (s3:GetObject)。

  2. 開啟位於 https://console.aws.amazon.com/glue/ 的 AWS Glue 主控台。

    以具有註冊藍圖的許可的使用者身分登入。切換到與 Amazon S3 儲存貯體相同的 AWS 區域,其中包含藍圖 ZIP 封存。

  3. 在導覽窗格中,選擇 blueprints (藍圖)。然後在 blueprints (藍圖) 頁面,選擇 Add blueprint (新增藍圖)。

  4. 輸入藍圖名稱,以及選用描述。

  5. 對於 ZIP archive location (S3) (ZIP 封存位置 (S3)),輸入已上傳藍圖 ZIP 封存的 Amazon S3 路徑。在路徑中包含封存檔案名稱,並以 s3:// 開頭。

  6. (選用) 新增標記一或多個標籤。

  7. 選擇 Add blueprint (新增藍圖)

    blueprints (藍圖) 頁面會傳回,並顯示藍圖狀態為 CREATING。選擇重新整理按鈕,直到狀態變更為 ACTIVEFAILED

  8. 如果狀態為 FAILED,請選取藍圖,然後在 Actions (動作) 選單,選擇 View (檢視)

    詳細資訊頁面會顯示失敗的原因。如果錯誤訊息為「無法存取以下位置的物件...」「以下位置的物件存取被拒絕...」,請檢閱下列需求:

    • 您登入的使用者身分必須具有 Amazon S3 中藍圖 ZIP 封存的讀取許可。

    • 包含 ZIP 封存的 Amazon S3 儲存貯體必須有儲存貯體政策,以授權物件的讀取許可給您的 AWS 帳戶 ID。如需詳細資訊,請參閱 AWS Glue 中的開發藍圖

    • 您使用的 Amazon S3 儲存貯體必須與您在主控台上登入的區域位在同一區域。

  9. 確保資料分析師具有藍圖的許可。

    藍圖的資料分析師許可 中顯示適用於資料分析師的建議 IAM 政策。此政策授予任何資源上的 glue:GetBlueprint。如果您的政策在資源層級更精細,請授與資料分析師對此新建立資源的許可。

註冊藍圖 (AWS CLI)
  1. 輸入以下命令。

    aws glue create-blueprint --name <blueprint-name> [--description <description>] --blueprint-location s3://<s3-path>/<archive-filename>
  2. 如要檢查藍圖狀態,請輸入以下命令。重複此指令,直到狀態變為 ACTIVEFAILED

    aws glue get-blueprint --name <blueprint-name>

    如果狀態為 FAILED 並且錯誤訊息為「無法存取以下位置的物件...」「以下位置的物件存取被拒絕...」中,請檢閱下列需求:

    • 您登入的使用者身分必須具有 Amazon S3 中藍圖 ZIP 封存的讀取許可。

    • 包含 ZIP 封存的 Amazon S3 儲存貯體必須有儲存貯體政策,以授權物件的讀取許可給您的 AWS 帳戶 ID。如需詳細資訊,請參閱 發佈藍圖

    • 您使用的 Amazon S3 儲存貯體必須與您在主控台上登入的區域位在同一區域。