Apache Iceberg のテーブル AWS Clean Rooms - AWS Clean Rooms

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Apache Iceberg のテーブル AWS Clean Rooms

Apache Iceberg は、データレイクのオープンソーステーブル形式です。 に保存されている統計 AWS Clean Rooms を使用できます。Apache Iceberg メタデータを使用して、クエリプランを最適化し、クリーンルームクエリ処理中のファイルスキャンを削減します。詳細については、Apache Iceberg のドキュメントを参照してください。

Iceberg テーブル AWS Clean Rooms で を使用する場合は、次の点を考慮してください。

  • AWS Glue Data Catalog のみ内のテーブル – Apache Iceberg テーブルは、オープンソースのグルーカタログ実装 AWS Glue Data Catalog に基づいて で定義する必要があります。

  • Parquet ファイル形式 – Parquet データファイル形式の Iceberg テーブル AWS Clean Rooms のみをサポートします。

  • GZIP および Snappy 圧縮 — GZIPと で Parquet AWS Clean Rooms をサポート Snappy 圧縮。

  • Iceberg バージョン – バージョン 1 およびバージョン 2 Iceberg テーブルに対するクエリの実行 AWS Clean Rooms をサポートします。

  • パーティション – のパーティションを手動で追加する必要はありません。Apache Iceberg のテーブル AWS Glue。 で新しいパーティション AWS Clean Rooms を検出 Apache Iceberg テーブルは自動で、テーブル定義のパーティションを更新するために手動操作は必要ありません。Iceberg パーティションは、 AWS Clean Rooms テーブルスキーマでは通常の列として表示され、設定済みテーブルスキーマではパーティションキーとして個別に表示されません。

  • 制限

    • 新しい Iceberg テーブルのみ

      Apache Iceberg から変換されたテーブル Apache Parquet テーブルはサポートされていません。

    • タイムトラベルクエリ

      AWS Clean Rooms は、 でのタイムトラベルクエリをサポートしていません。Apache Iceberg テーブル。

    • Athena エンジンバージョン 2

      Iceberg Athena エンジンバージョン 2 で作成されたテーブルはサポートされていません。

    • ファイル形式

      Avro および Optimized Row Columnar (ORC) ファイル形式はサポートされていません。

    • 圧縮

      Zstandard の (Zstd) 圧縮 Parquet はサポートされていません。

Iceberg テーブルでサポートされているデータ型

AWS Clean Rooms はクエリできます Iceberg 次のデータ型を含むテーブル。

  • boolean

  • date

  • decimal

  • double

  • float

  • int

  • list

  • long

  • map

  • string

  • struct

  • timestamp without time zone

Iceberg のデータ型の詳細については、Apache Iceberg ドキュメントで Iceberg のスキーマを参照してください。