與 AWS Glue 的整合 - Amazon Athena

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

與 AWS Glue 的整合

AWS Glue 是全受管的 ETL (擷取、轉換和載入) AWS 服務。其關鍵能力之一是分析和分類資料。您可以使用 AWS Glue 爬蟲程式,根據 Amazon S3 中的資料自動推斷資料庫和資料表結構描述,然後將相關聯的中繼資料存放在 AWS Glue Data Catalog 中。

Athena 使用 AWS Glue Data Catalog 在您的 Amazon Web Services 帳戶中存放和擷取 Amazon S3 資料的資料表中繼資料。資料表中繼資料可讓 Athena 查詢引擎知道如何尋找、讀取和處理您想要查詢的資料。

若要在 AWS Glue Data Catalog 中建立資料庫和資料表結構描述,您可以在 Athena 中的資料來源上執行 AWS Glue 爬蟲程式,或直接在 Athena 查詢編輯器中執行資料定義語言 (DDL) 查詢。然後,透過您建立的資料庫和資料表結構描述,您可以使用 Athena 中的資料操作 (DML) 查詢來查詢資料。

您可以從您自己以外的帳戶註冊 AWS Glue Data Catalog。在您為 AWS Glue 設定所需的 IAM 許可後,您可以使用 Athena 執行跨帳戶查詢。如需更多詳細資訊,請參閱 跨帳戶存取 AWS Glue 資料目錄

如需有關 AWS Glue Data Catalog 的詳細資訊,請參閱《AWS Glue 開發人員指南》中的 AWS Glue 中的資料目錄和爬蟲程式

使用 AWS Glue 需另外付費。如需詳細資訊,請參閱 AWS Glue 定價