Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzo Apache Iceberg delle tabelle in AWS Clean Rooms
Apache Icebergè un formato di tabella open source per data lake. AWS Clean Rooms può utilizzare le statistiche memorizzate nei Apache Iceberg metadati per ottimizzare i piani di interrogazione e ridurre le scansioni dei file durante l'elaborazione delle query in camera bianca. Per ulteriori informazioni, consulta la documentazione di Apache Iceberg
Considerate quanto segue quando utilizzate AWS Clean Rooms con le tabelle Iceberg:
-
Tabelle all'interno di AWS Glue Data Catalog Only: Apache Iceberg le tabelle devono essere definite in AWS Glue Data Catalog base all'implementazione open source del catalogo Glue
. -
Formato di file Parquet: supporta AWS Clean Rooms solo le tabelle Iceberg nel formato di file di dati Parquet.
-
Compressione GZIP e Snappy: AWS Clean Rooms supporta Parquet con GZIP e compressione. Snappy
-
Versioni Iceberg: AWS Clean Rooms supporta l'esecuzione di query sulle tabelle Iceberg versione 1 e versione 2.
-
Partizioni: non è necessario aggiungere manualmente le partizioni per le tabelle. Apache Iceberg AWS Glue AWS Clean Rooms rileva automaticamente le nuove partizioni nelle Apache Iceberg tabelle e non è necessaria alcuna operazione manuale per aggiornare le partizioni nella definizione della tabella. Le partizioni Iceberg vengono visualizzate come colonne regolari nello schema della AWS Clean Rooms tabella e non separatamente come chiave di partizione nello schema della tabella configurato.
-
Limitazioni
-
Solo nuove tabelle Iceberg
Apache Icebergle tabelle convertite da Apache Parquet tabelle non sono supportate.
-
Query temporali
AWS Clean Rooms non supporta le interrogazioni sui viaggi nel tempo con le Apache Iceberg tabelle.
-
Motore Athena versione 2
Icebergle tabelle create con la versione 2 del motore Athena non sono supportate.
-
Formati di file
Avroe i formati di file Orc (Optimized Row Columnar) non sono supportati.
-
Compressione
ZstandardLa compressione (Zstd) per non è supportata. Parquet
-
Tipi di dati supportati per le tabelle Iceberg
AWS Clean Rooms può interrogare Iceberg tabelle che contengono i seguenti tipi di dati:
-
boolean
-
date
-
decimal
-
double
-
float
-
int
-
list
-
long
-
map
-
string
-
struct
-
timestamp without time zone
Per ulteriori informazioni sui tipi di tabella Iceberg, consulta Schemi per Iceberg