データ用に SerDe を選択する - Amazon Athena

データ用に SerDe を選択する

次の表には、Athena でサポートされているデータ形式と、それらに対応する SerDe ライブラリが一覧表示されています。

サポートされるデータ形式と SerDes
データ形式	説明	Athena でサポートされる SerDe タイプ
Amazon Ion	Amazon Ion は JSON のスーパーセットであるリッチタイプの自己記述データ形式で、Amazon によって開発およびオープンソース化されています。	Amazon Ion Hive SerDe を使用します。
Apache Avro	Hadoop にデータを保存する形式であり、JSON ベースのスキーマをレコード値として使用します。	Avro SerDe を使用します。
Apache Parquet	Hadoop のデータの列指向ストレージ形式。	Parquet SerDe および SNAPPY 圧縮を使用します。
Apache WebServer ログ	Apache WebServer にログを保存する形式。	Grok SerDe または Regex SerDe を使用します。
CloudTrail ログ	CloudTrail にログを保存するための形式。	Hive JSON SerDe を使用します。詳細については、「AWS CloudTrail ログをクエリする」を参照してください。
CSV (カンマ区切り値)	CSV のデータでは、各行がデータレコードを表し、各レコードはカンマで区切られた 1 つ以上のフィールドで構成されます。	引用符で囲まれた値がデータに含まれていない場合や、`java.sql.Timestamp` 形式を使用している場合は、CSV、TSV、カスタム区切りファイル用の Lazy Simple SerDeを使用します。引用符で囲まれた値がデータに含まれている場合や、`TIMESTAMP` に UNIX の数値形式 (例えば、`1564610311`) を使用している場合は、CSV を処理するための Open CSV SerDe を使用します。
カスタム区切り	この形式のデータでは、各行がデータレコードを表し、レコード間は 1 文字のカスタム区切り文字で区切られます。	CSV、TSV、カスタム区切りファイル用の Lazy Simple SerDe を使用し、1 文字のカスタム区切り文字を指定します。
JSON (JavaScript Object Notation)	JSON データでは、各行がデータレコードを表します。各レコードは属性と値のペアと配列で構成され、それぞれがカンマで区切られます。	Hive JSON SerDe を使用します。 OpenX JSON SerDe を使用します。
Logstash ログ	Logstash にログを保存する形式。	Grok SerDe を使用します。
ORC (Optimized Row Columnar)	Hive データの最適化された列指向ストレージの形式。	ORC SerDe および ZLIB 圧縮を使用します。
TSV (タブ区切り値)	TSV のデータでは、各行がデータレコードを表し、各レコードはタブで区切られた 1 つ以上のフィールドで構成されます。	CSV、TSV、カスタム区切りファイル用の Lazy Simple SerDe を使用し、区切り文字を `FIELDS TERMINATED BY '\t'` に指定します。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

SerDe を使用する

SerDe を使用してテーブルを作成する