AWS Glue を使用して Athena を Amazon S3 のデータに接続する
Athena は、Amazon S3 に保存されているデータのテーブルおよび列の名前などのメタデータを保存するために AWS Glue Data Catalog を使用します。このメタデータ情報は、Athena クエリエディタに表示されるデータベース、テーブル、ビューになります。
Athena で AWS Glue Data Catalog を使用するときは、AWS Glue を使用して Athena でクエリされるデータベースとテーブル (スキーマ) を作成するか、Athena を使用してスキーマを作成してから AWS Glue や関連サービスでそれらを使用することができます。
AWS Glue のスキーマ情報を定義するには、Athena コンソールでフォームを使用するか、Athena でクエリエディタを使用するか、または AWS Glue コンソールで AWS Glue クローラーを作成します。AWS Glue クローラーは、Amazon S3 のデータからデータベースとテーブルスキーマを自動的に推論します。フォームを使用すると、よりカスタマイズできます。独自の CREATE TABLE
ステートメントを記述するには、より多くの労力が必要ですが、最も強力なコントロールが得られます。詳細については、「CREATE TABLE」を参照してください。
その他のリソース
-
AWS Glue Data Catalog に関する詳細については、「AWS Glue デベロッパーガイド」の「AWS Glue のデータカタログおよびクローラー」を参照してください。
-
AWS Glue と Athena を使用して XML データを処理する方法については、AWS Big Data Blog 記事「Process and analyze highly nested and large XML files using AWS Glue and Amazon Athena
」を参照してください。 -
AWS Glue には別料金が適用されます。詳細については、「AWS Glue 料金表
」を参照してください。