AWS Glue との統合 - Amazon Athena

AWS Glue との統合

AWS Glue は、データの分類、消去、強化、およびさまざまなデータストア間での移動を確実にできる、フルマネージド型 ETL(抽出、変換、ロード)サービスです。AWS Glue クローラは、データセットからデータベースとテーブルスキーマを自動的に推論し、関連するメタデータを AWS Glue データカタログ に格納します。

Athena は、AWS Glue データカタログ に登録されたデータセットおよびデータソースのクエリをネイティブにサポートします。Data Catalog をソースとして Athena でデータ操作言語 (DML) を実行する際、Data Catalog スキーマを使用して基になるデータセットからインサイトを取得します。データ定義言語 (DDL) クエリを実行すると、定義するスキーマが AWS Glue データカタログ で定義されます。Athena 内から、データソースで AWS Glue クローラを実行して AWS Glue データカタログ でスキーマを作成することもできます。

AWS Glue がサポートされるリージョンの場合、Athena は AWS アカウント全体のテーブルメタデータの一元的な保存および取得の場所として AWS Glue データカタログを使用します。Athena 実行エンジンは、データの読み取り先、読み取り方法、その他データ処理に必要な情報をテーブルメタデータから取得する必要があります。AWS Glue データカタログは、さまざまなデータソースおよびデータ形式にわたって一本化されたメタデータリポジトリを提供します。そのために、Athena だけでなく Amazon S3、Amazon RDS、Amazon Redshift、Amazon Redshift Spectrum、Amazon EMR、その他 Apache Hive メタストアと互換性のあるすべてのアプリケーションと連携します。

AWS Glue データカタログの詳細については、AWS Glue 開発者ガイドの「AWS Glue データカタログの作成」を参照してください。AWS Glue が利用可能なリージョンのリストについては、AWS 全般リファレンスの「リージョンとエンドポイント」を参照してください。

AWS Glue には別料金が適用されます。詳細については、「AWS Glue の料金」と「AWS Glue には別料金が適用されますか?」を参照してください。 Athena で AWS Glue を使用する利点については、「AWS Glue データカタログにアップグレードする理由は?」を参照してください。