設定以 AWS Glue 使用 Python - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

設定以 AWS Glue 使用 Python

使用 Python 開發 Spark 任務的 ETL 指令碼。ETL 任務支援的 Python 版本取決於任務的 AWS Glue 版本。如需有關 AWS Glue 版本的詳細資訊,請參閱 Glue version job property

設定您的系統以 AWS Glue 使用 Python

依照以下步驟安裝 Python 以及能夠呼叫 AWS Glue API。

  1. 如果您尚未安裝 Python,請至 Python.org 下載頁面下載及安裝。

  2. 依照 AWS CLI 文件所述的方式,安裝 AWS Command Line Interface (AWS CLI)。

    使用 Python 並不一定需要 AWS CLI。但是,對於使用您的帳戶登入資料來設定並驗證 AWS 是否正常運作而言,安裝並設定它是很便利的方法。

  3. 依照 Boto3 快速入門所述的方式,安裝適用於 Python 的 AWS SDK (Boto 3)。

    AWS Glue 尚未提供 Boto 3 資源 API。目前,只能使用 Boto 3 用戶端 API。

    如需有關 Boto 3 的詳細資訊,請參閱AWSSDK for Python (Boto3) 入門

您可以在 GitHub 網站上的 AWS Glue 範例儲存庫中,找到適用於 AWS Glue 的 Python 程式碼範例與公用程式。