列指向形式への変換 - Amazon Athena

列指向形式への変換

データを Apache Parquet または ORC などのオープンソースの列指向形式に変換すると、Amazon Athena のクエリパフォーマンスが向上します。

JSON や CSV などのソースデータを列指向形式に簡単に変換するためのオプションには、CREATE TABLE AS クエリや、AWS Glue でのジョブの実行などがあります。

  • CREATE TABLE AS (CTAS) クエリを使用すると、データを Parquet または ORC に 1 ステップで変換できます。例については、「CTAS クエリの例」ページの「例: クエリ結果を異なる形式で書き込む」を参照してください。

  • CSV データを Parquet に変換する AWS Glue ジョブの実行については、AWS ビッグデータブログの記事「Build a Data Lake Foundation with AWS Glue and Amazon S3」(AWS Glue と Amazon S3 で Data Lake Foundation を構築する) で、「Transform the data from CSV to Parquet format」(CSV から Parquet 形式へのデータの変換) を参照してください。AWS Glue では CSV データの ORC への変換、あるいは JSON データの Parquet または ORC への変換にも、同じ手法を使用できます。