Amazon Athena
ユーザーガイド

圧縮形式

Athena は以下の圧縮形式をサポートしています。

注記

このセクションに記載されている圧縮形式は CREATE TABLE クエリで使用されます。CTAS クエリの場合、Athena では (Parquet および ORC に保存されているデータに対して) GZIP と SNAPPY がサポートされています。圧縮形式を省略すると、デフォルトで GZIP 形式が使用されます。詳細については、「CREATE TABLE AS」を参照してください。

  • SNAPPY。これは Parquet データストレージ形式のファイルに対するデフォルトの圧縮形式です。

  • ZLIB。これは ORC データストレージ形式のファイルに対するデフォルトの圧縮形式です。

  • LZO

  • GZIP。

    CSV、TSV、および JSON のデータについては、Athena がファイル拡張子から圧縮タイプを判断します。存在しない場合、データは解凍されません。データが圧縮されている場合は、ファイル名に圧縮の拡張子 (gz など) が含まれていることを確認します。

    Athena は、Amazon Kinesis Data Firehose ログに対するクエリでは GZIP 圧縮を使用します。Athena と Amazon Kinesis Data Firehose ではサポートされている SNAPPY のバージョンが異なるため、互換性のある形式は GZIP のみです。