建立 Amazon Redshift 來源節點 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立 Amazon Redshift 來源節點

需要的許可

使用 Amazon Redshift 資料來源的 AWS Glue Studio 任務需要額外的許可。如需有關如何向 ETL 任務新增許可的詳細資訊,請參閱 Review IAM permissions needed for ETL jobs

需要下列許可才能使用 Amazon Redshift 連線。

  • redshift-data:ListSchemas

  • redshift-data:ListTables

  • redshift-data:DescribeTable

  • redshift-data:ExecuteStatement

  • redshift-data:DescribeStatement

  • redshift-data:GetStatementResult

新增 Amazon Redshift 資料來源

若要新增資料來源 – Amazon Redshift 節點:
  1. 選擇 Amazon Redshift 存取類型:

    • 直接資料連線 (建議):如果您要直接存取 Amazon Redshift 資料,請選擇此選項。這是建議的選項,也是預設選項。

    • Data Catalog tables:如果您有要使用的資料型錄資料表,請選擇此選項。

  2. 如果選擇直接資料連線,請選擇 Amazon Redshift 資料來源的連線。假設連線已存在,您可以從現有的連線中進行選擇。如果您需要建立連線,請選擇建立 Redshift 連線。如需詳細資訊,請參閱 Overview of using connectors and connections

    選擇連線之後,您可以按一下檢視屬性來檢視連線屬性。隨即會顯示連線的相關資訊,包括 URL、安全群組、子網路、可用區域、說明,以及建立的 (UTC) 和上次更新的 (UTC) 時間戳記。

  3. 選擇 Amazon Redshift 來源選項:

    • 選擇單一資料表:此資料表包含您要從單一 Amazon Redshift 資料表存取的資料。

    • 輸入自訂查詢:可讓您根據自訂查詢從多個 Amazon Redshift 資料表存取資料集。

  4. 如果您選擇單一資料表,請選擇 Amazon Redshift 結構描述。可供選擇的結構描述清單由選取的資料表決定。

    或者,選擇輸入自訂查詢。選擇此選項可從多個 Amazon Redshift 資料表存取自訂資料集。當您選擇此選項時,請輸入 Amazon Redshift 查詢。

    連線至 Amazon Redshift 無伺服器環境時,請將下列許可新增至自訂查詢:

    GRANT SELECT ON ALL TABLES IN <schema> TO PUBLIC

    您可以選擇推論結構描述,根據您輸入的查詢讀取結構描述。您也可以選擇開啟 Redshift 查詢編輯器以輸入 Amazon Redshift 查詢。如需詳細資訊,請參閱 Querying a database using the query editor

  5. 效能和安全性中,選擇 Amazon S3 暫存目錄和 IAM 角色。

    • Amazon S3 暫存目錄:選擇暫存資料的 Amazon S3 位置。

    • IAM 角色:選擇可寫入您選取之 Amazon S3 位置的 IAM 角色。

  6. 自訂 Redshift 參數 - 選用中,輸入參數和值。