與整合 AWS Glue - Amazon Athena

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

與整合 AWS Glue

AWS Glue是完全受管的 ETL (擷取、轉換和載入) AWS 服務。其關鍵能力之一是分析和分類資料。您可以使用 AWS Glue 檢索器從 Amazon S3 中的資料自動推斷資料庫和表格結構描述,並將相關的中繼資料存放在. AWS Glue Data Catalog

Athena 會使 AWS Glue Data Catalog 用在您的亞馬遜網路服務帳戶中存放和擷取 Amazon S3 資料的表格中繼資料。資料表中繼資料可讓 Athena 查詢引擎知道如何尋找、讀取和處理您想要查詢的資料。

若要在中建立資料庫和資料表結構描述 AWS Glue Data Catalog,您可以從 Athena 內部的資料來源執行 AWS Glue 爬行者程式,或直接在 Athena 查詢編輯器中執行資料定義語言 (DDL) 查詢。然後,透過您建立的資料庫和資料表結構描述,您可以使用 Athena 中的資料操作 (DML) 查詢來查詢資料。

您可以 AWS Glue Data Catalog 從您自己以外的帳戶註冊。設定所需的 IAM 許可後 AWS Glue,您可以使用 Athena 執行跨帳戶查詢。如需詳細資訊,請參閱 跨帳戶存取 AWS Glue 資料目錄

如需有關的詳細資訊 AWS Glue Data Catalog,請參閱AWS Glue 開發人員指南 AWS Glue中的〈資料目錄和檢索器〉。

如需說明如何使用 AWS Glue 和 Athena 處理 XML 資料的說明性文章,請參閱大數據部落格中的使用和 Amazon Athena 處理 AWS Glue 和分析高度巢狀和 AWS 大型 XML 檔案

另外收費適用於 AWS Glue。如需詳細資訊,請參閱 AWS Glue 定價