Apache Iceberg Tische in AWS Clean Rooms - AWS Clean Rooms

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Apache Iceberg Tische in AWS Clean Rooms

Apache Iceberg ist ein Open-Source-Tabellenformat für Data Lakes. AWS Clean Rooms kann die Statistiken verwenden, die in gespeichert sind Apache Iceberg Metadaten zur Optimierung von Abfrageplänen und zur Reduzierung der Anzahl von Dateiscans bei der Verarbeitung von Abfragen im Reinraum. Weitere Informationen finden Sie in der Apache Iceberg-Dokumentation.

Beachten Sie bei der Verwendung AWS Clean Rooms mit Iceberg-Tabellen Folgendes:

  • Tabellen innerhalb des AWS Glue Data Catalog einzigen — Apache Iceberg Tabellen müssen in der Implementierung des AWS Glue Data Catalog Open-Source-Glue-Katalogs definiert werden.

  • Parquet-Dateiformat — unterstützt AWS Clean Rooms nur Iceberg-Tabellen im Parquet-Datendateiformat.

  • GZIPund Snappy-Komprimierung — AWS Clean Rooms unterstützt Parquet mit und GZIP Snappy Komprimierung.

  • Iceberg-Versionen — AWS Clean Rooms unterstützt das Ausführen von Abfragen für Iceberg-Tabellen der Versionen 1 und 2.

  • Partitionen — Sie müssen keine Partitionen manuell hinzufügen Apache Iceberg Tabellen in AWS Glue. AWS Clean Rooms erkennt neue Partitionen in Apache Iceberg Tabellen automatisch und es ist kein manueller Vorgang erforderlich, um Partitionen in der Tabellendefinition zu aktualisieren. Iceberg-Partitionen erscheinen als reguläre Spalten im AWS Clean Rooms Tabellenschema und nicht separat als Partitionsschlüssel im konfigurierten Tabellenschema.

  • Einschränkungen

    • Nur neue Iceberg-Tabellen

      Apache Iceberg Tabellen wurden konvertiert von Apache Parquet Tabellen werden nicht unterstützt.

    • Zeitreiseabfragen

      AWS Clean Rooms unterstützt keine Zeitreiseabfragen mit Apache Iceberg Tabellen.

    • Athena-Engine-Version 2

      Iceberg Tabellen, die mit der Athena-Engine Version 2 erstellt wurden, werden nicht unterstützt.

    • Dateiformate

      Avro Die Dateiformate Optimized Row Columnar (ORC) werden nicht unterstützt.

    • Komprimierung

      Zstandard (Zstd) -Komprimierung für Parquet wird nicht unterstützt.

Unterstützte Datentypen für Iceberg-Tabellen

AWS Clean Rooms kann abfragen Iceberg Tabellen, die die folgenden Datentypen enthalten:

  • boolean

  • date

  • decimal

  • double

  • float

  • int

  • list

  • long

  • map

  • string

  • struct

  • timestamp without time zone

Weitere Informationen zu Iceberg-Datentypen finden Sie unter Schemata für Iceberg in der Apache-Iceberg-Dokumentation.