Utilizzo Apache Iceberg delle tabelle in AWS Clean Rooms - AWS Clean Rooms

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo Apache Iceberg delle tabelle in AWS Clean Rooms

Apache Icebergè un formato di tabella open source per data lake. AWS Clean Rooms può utilizzare le statistiche memorizzate nei Apache Iceberg metadati per ottimizzare i piani di interrogazione e ridurre le scansioni dei file durante l'elaborazione delle query in camera bianca. Per ulteriori informazioni, consulta la documentazione di Apache Iceberg.

Considerate quanto segue quando utilizzate AWS Clean Rooms con le tabelle Iceberg:

  • Tabelle all'interno di AWS Glue Data Catalog Only: Apache Iceberg le tabelle devono essere definite in AWS Glue Data Catalog base all'implementazione open source del catalogo Glue.

  • Formato di file Parquet: supporta AWS Clean Rooms solo le tabelle Iceberg nel formato di file di dati Parquet.

  • Compressione GZIP e Snappy: AWS Clean Rooms supporta Parquet con GZIP e compressione. Snappy

  • Versioni Iceberg: AWS Clean Rooms supporta l'esecuzione di query sulle tabelle Iceberg versione 1 e versione 2.

  • Partizioni: non è necessario aggiungere manualmente le partizioni per le tabelle. Apache Iceberg AWS Glue AWS Clean Rooms rileva automaticamente le nuove partizioni nelle Apache Iceberg tabelle e non è necessaria alcuna operazione manuale per aggiornare le partizioni nella definizione della tabella. Le partizioni Iceberg vengono visualizzate come colonne regolari nello schema della AWS Clean Rooms tabella e non separatamente come chiave di partizione nello schema della tabella configurato.

  • Limitazioni

    • Solo nuove tabelle Iceberg

      Apache Icebergle tabelle convertite da Apache Parquet tabelle non sono supportate.

    • Query temporali

      AWS Clean Rooms non supporta le interrogazioni sui viaggi nel tempo con le Apache Iceberg tabelle.

    • Motore Athena versione 2

      Icebergle tabelle create con la versione 2 del motore Athena non sono supportate.

    • Formati di file

      Avroe i formati di file Orc (Optimized Row Columnar) non sono supportati.

    • Compressione

      ZstandardLa compressione (Zstd) per non è supportata. Parquet

Tipi di dati supportati per le tabelle Iceberg

AWS Clean Rooms può interrogare Iceberg tabelle che contengono i seguenti tipi di dati:

  • boolean

  • date

  • decimal

  • double

  • float

  • int

  • list

  • long

  • map

  • string

  • struct

  • timestamp without time zone

Per ulteriori informazioni sui tipi di tabella Iceberg, consulta Schemi per Iceberg nella documentazione di Apache.