與 AWS Glue 的整合 - Amazon Athena

與 AWS Glue 的整合

AWS Glue 是全受管的 ETL (擷取、轉換和載入) AWS 服務。其關鍵能力之一是分析和分類資料。您可以使用 AWS Glue 編目程式,根據 Amazon S3 中的資料自動推斷資料庫和資料表結構描述,然後將相關聯的中繼資料存放在 AWS Glue Data Catalog 中。

Athena 使用 AWS Glue Data Catalog 在您的 Amazon Web Services 帳戶中存放和擷取 Amazon S3 資料的資料表中繼資料。資料表中繼資料可讓 Athena 查詢引擎知道如何尋找、讀取和處理您想要查詢的資料。

若要在 AWS Glue Data Catalog 中建立資料庫和資料表結構描述,您可以在 Athena 中的資料來源上執行 AWS Glue 編目程式,或直接在 Athena 查詢編輯器中執行資料定義語言 (DDL) 查詢。然後,透過您建立的資料庫和資料表結構描述,您可以使用 Athena 中的資料操作 (DML) 查詢來查詢資料。

您可以從您自己以外的帳戶註冊 AWS Glue Data Catalog。在您為 AWS Glue 設定所需的 IAM 許可後,您可以使用 Athena 執行跨帳戶查詢。如需詳細資訊,請參閱跨帳戶存取 AWS Glue 資料目錄

如需有關 AWS Glue Data Catalog 的詳細資訊,請參閱《AWS Glue 開發人員指南》中的填入 AWS Glue Data Catalog

使用 AWS Glue 需另外付費。如需詳細資訊,請參閱 AWS Glue 定價使用 AWS Glue 是否需另外收費? 如需有關搭配 Athena 使用 AWS Glue 的優點之詳細資訊,請參閱為何應升級到 AWS Glue Data Catalog?