開始使用自訂視覺化轉換 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

開始使用自訂視覺化轉換

若要建立自訂視覺化轉換,請執行以下步驟。

  • 步驟 1. 建立 JSON 組態檔案

  • 步驟 2. 實作轉換邏輯

  • 步驟 3. 驗證自訂視覺化轉換

  • 步驟 4. 視需要更新自訂視覺化轉換

  • 步驟 5. 在 AWS Glue Studio 中使用自訂視覺化轉換

透過設定 Amazon S3 儲存貯體開始使用,然後繼續步驟 1. 建立 JSON 組態檔案。

先決條件

客戶提供的轉換資料位於客戶 AWS 帳戶內。該帳戶擁有轉換,因此擁有檢視 (搜尋和使用)、編輯或刪除轉換的所有許可。

為了在 AWS Glue Studio 中使用自訂轉換,您需要建立兩個檔案並將其上傳到該 AWS 帳戶中的 Amazon S3 資產儲存貯體:

  • Python 檔案 - 包含轉換函數

  • JSON 檔案 – 描述轉換。這也稱為定義轉換所需的組態檔案。

為了將檔案配對在一起,請對兩者使用相同名稱。例如:

  • myTransform.json

  • myTransform.py

或者,您可以透過提供包含圖示的 SVG 檔案,為自訂視覺化轉換指定自訂圖示。為了將檔案配對在一起,請對圖示使用相同名稱:

  • myTransform.svg

AWS Glue Studio 將使用各自的檔案名稱自動比對它們。任何現有模組的檔案名稱皆不能相同。

AWS Glue Studio 會將檔案作為模組 (例如 import myTransform) 匯入任務指令碼中。因此,您的檔案名必須遵循為 Python 變數名稱 (識別符) 設定的相同命名規則。具體來說,名稱必須以字母或底線開頭,且完全由字母、數字和/或底線組成。

注意

確保轉換檔案名稱不會與現有的載入 Python 模組 (例如 sys, array, copy 等) 衝突,避免出現未預期的執行時間問題。

設定 Amazon S3 儲存貯體

您建立的轉換會存放在 Amazon S3 中,且由您的 AWS 帳戶擁有。只要將檔案 (json 和 py) 上傳到目前存放所有任務指令碼的 Amazon S3 資產資料夾 (例如 s3://aws-glue-assets-<accountid>-<region>/transforms),即可建立新的自訂視覺化轉換。如果使用自訂圖示,也可以將其上傳。按預設,AWS Glue Studio 將從相同 S3 儲存貯體的 /transforms 資料夾中讀取所有 .json 檔案。