將 Data Catalog 資料表用於資料來源 - AWS Glue

將 Data Catalog 資料表用於資料來源

對於除 Amazon S3 和連接器以外的所有資料來源，資料表必須存在於 AWS Glue Data Catalog，以取得您選擇的來源類型。AWS Glue 不會建立 Data Catalog 資料表。

根據 Data Catalog 資料表設定資料來源節點

前往新任務或已儲存任務的視覺化編輯器。
在任務圖表中選擇資料來源節點。
選擇 Data source properties (資料來源屬性) 索引標籤，然後輸入下列資訊：
- S3 source type (S3 來源類型)：(僅適用於 Amazon S3 資料來源) 選擇 Select a Catalog table (選取目錄資料表) 以使用現有 AWS Glue Data Catalog 資料表。
- Database (資料庫)：在 Data Catalog 中選擇包含您要用於此任務之來源資料表的資料庫。您可以使用搜尋欄位來依名稱搜尋資料庫。
- Table (資料表)：從清單中選擇與來源資料相關聯的資料表。此資料表必須已存在於 AWS Glue Data Catalog。您可以使用搜尋欄位來依名稱搜尋資料表。
- Partition predicate (分割區述詞)：(僅適用於 Amazon S3 資料來源) 輸入以 Spark SQL 為基礎的布林表達式，該表達式僅包含分割欄，例如："(year=='2020' and month=='04')"
- Temporary directory (暫時目錄): (僅適用於 Amazon Redshift 資料來源) 輸入 Amazon S3 中工作目錄位置的路徑，您的 ETL 任務可以在此處寫入暫時的中繼結果。
- Role associated with the cluster (與叢集相關聯的角色): (僅適用於 Amazon Redshift 資料來源) 輸入您的 ETL 任務要使用的角色，該角色包含 Amazon Redshift 叢集的許可。如需詳細資訊，請參閱資料來源和資料目標許可。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

修改資料來源節點的屬性

將連接器用於資料來源