Amazon Athena
ユーザーガイド

テーブル、データベース、およびデータカタログの理解

Athena では、テーブルとデータベースはメタデータ定義のコンテナです。これにより、基になるソースデータのスキーマを定義します。Athena では、データセットごとにテーブルが必要です。テーブルのメタデータは、Amazon S3 内のデータの保存先を Athena に指示し、列名、データ型、テーブル名などのデータの構造を指定します。データベースは、テーブルを論理的なグループにまとめたものであり、データセットのメタデータおよびスキーマ情報のみを保持します。

Athena では、クエリ対象のデータセットごとに基になるテーブルが必要です。このテーブルに、取得したクエリの結果が返されます。したがって、データをクエリする前に、Athena にテーブルを登録しておく必要があります。登録は、テーブルの自動作成または手動作成に伴って行われます。

テーブルの作成方法に関係なく、テーブル作成プロセスに伴ってデータセットが Athena に登録されます。登録先は AWS Glue データカタログまたは Athena 内のデータカタログです。この登録によって Athena はデータに対するクエリを実行できます。

  • テーブルを自動作成するには、Athena 内から AWS Glue クローラを使用します。AWS Glue およびクローラの詳細については、「AWS Glue との統合」を参照してください。AWS Glue で作成したテーブルは、独自の AWS Glue Data Catalog に登録されます。Athena は、AWS Glue Data Catalog を使用して、このメタデータを保存および取得したり、クエリを実行して基となるデータセットを分析したりします。

AWS Glue Data Catalog は、AWS アカウント全体でアクセスできます。その他の AWS サービスが AWS Glue Data Catalog を共有できるため、Athena を使用して組織全体で作成されたデータベースやテーブルを確認でき、その逆もできます。さらに、AWS Glue ではデータスキーマを自動検出し、データの抽出、変換、ロード (ETL) を行うことができます。

注記

AWS Glue が提供されていないリージョンや AWS Glue Data Catalog が使用できないリージョンでは、Athena の内部データカタログを使用します。

  • テーブルを手動で作成するには

    • Athena コンソールを使用してテーブル作成ウィザードを実行します。

    • Athena コンソールを使用して Hive DDL ステートメントをクエリエディタに書き込みます。

    • Athena API または CLI で DDL ステートメントを使用して SQL クエリ文字列を実行します。

    • Athena JDBC または ODBC ドライバーを使用します。

テーブルやデータベースを手動で作成すると、Athena では内部で HiveQL データ定義言語 (DDL) ステートメント (CREATE TABLECREATE DATABASEDROP TABLE など) を使用し、テーブルやデータベースを AWS Glue データカタログ内に作成します。AWS Glue が提供されていないリージョンでは内部データカタログ内に作成します。

注記

2017 年 8 月 14 日より前に作成されたテーブルが Athena にある場合、これらは Athena が管理するデータカタログ内に作成されたものであり、更新するまでは AWS Glue データカタログと併存します。詳細については、「AWS Glue データカタログへのステップバイステップのアップグレード」を参照してください。

内部で既存のテーブルをクエリする場合、Amazon Athena は分散 SQL エンジンの Presto を使用します。Athena 内には、Athena を使用してテーブルを作成してクエリを実行する方法を示すために、サンプルデータを使用した例が用意されています。Athena コンソールには Amazon S3 の保存済みデータに基づいてテーブルの作成を開始するチュートリアルも用意されています。

  • テーブルの作成と Athena クエリエディタへのクエリの書き込みに関する詳細なチュートリアルについては、「開始方法」を参照してください。

  • コンソールで Athena チュートリアルを実行します。このチュートリアルは、https://console.aws.amazon.com/athena/ に初めてログインしたときに自動的に起動します。コンソールで [Tutorial] を選択して起動することもできます。