AWS Glue との統合 - Amazon Athena

AWS Glue との統合

AWS Glue は、フルマネージド型の AWS の ETL (抽出、変換、ロード) サービスです。データの分析と分類は、その主要機能の 1 つです。AWS Glue クローラは、Amazon S3 のデータからデータベースとテーブルのスキーマを自動的に推論し、関連するメタデータを AWS Glue Data Catalog に保存します。

Athena は、Amazon Web Services アカウントの Amazon S3 データに関するテーブルメタデータの保存と取得に AWS Glue Data Catalog を使用します。テーブルメタデータは、Athena クエリエンジンがクエリするデータの検索、読み取り、および処理方法を把握できるようにします。

AWS Glue Data Catalog でデータベースとテーブルのスキーマを作成するには、データソースに対して Athena 内から AWS Glue クローラを実行する、または Athena クエリエディタでデータ定義言語 (DDL) クエリを直接実行することができます。その後、作成したデータベースとテーブルのスキーマを使用して、データをクエリするために Athena でデータ操作言語 (DML) クエリを使用することができます。

AWS Glue Data Catalog は、所有するアカウント以外のアカウントから登録できます。AWS Glue に必要な IAM アクセス許可を設定したら、Athena を使用してクロスアカウントクエリを実行できます。詳細については、「」を参照してくださいデータカタログへのクロスアカウントアクセス

AWS Glue Data Catalog の詳細については、AWS Glue デベロッパーガイドの「AWS Glue Data Catalog の作成」を参照してください。

AWS Glue には別料金が適用されます。詳細については、「AWS Glue 料金表」と「AWS Glue には別料金が適用されますか?」を参照してください。Athena で AWS Glue を使用する利点の詳細については、「AWS Glue Data Catalog にアップグレードする理由」を参照してください。