Utilisation de Apache Iceberg tableaux dans AWS Clean Rooms - AWS Clean Rooms

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation de Apache Iceberg tableaux dans AWS Clean Rooms

Apache Icebergest un format de table open source pour les lacs de données. AWS Clean Rooms peut utiliser les statistiques stockées dans les Apache Iceberg métadonnées pour optimiser les plans de requêtes et réduire le nombre de scans de fichiers lors du traitement des requêtes en salle blanche. Pour plus d'informations, consultez la documentation d'Apache Iceberg.

Lorsque vous utilisez des tables Iceberg, tenez compte AWS Clean Rooms des points suivants :

  • Tables incluses dans le AWS Glue Data Catalog seul — Apache Iceberg les tables doivent être définies dans le sur la AWS Glue Data Catalog base de l'implémentation du catalogue Glue Open Source.

  • Format de fichier Parquet : prend AWS Clean Rooms uniquement en charge les tables Iceberg au format de fichier de données Parquet.

  • Compression GZIP et Snappy : AWS Clean Rooms supporte Parquet avec GZIP et compression. Snappy

  • Versions Iceberg : AWS Clean Rooms permet d'exécuter des requêtes sur les tables Iceberg des versions 1 et 2.

  • Partitions : vous n'avez pas besoin d'ajouter manuellement des partitions pour vos Apache Iceberg tables dans AWS Glue. AWS Clean Rooms détecte automatiquement les nouvelles partitions dans Apache Iceberg les tables et aucune opération manuelle n'est nécessaire pour mettre à jour les partitions dans la définition de table. Les partitions Iceberg apparaissent sous forme de colonnes normales dans le schéma de AWS Clean Rooms table et non séparément sous forme de clé de partition dans le schéma de table configuré.

  • Limites

    • Nouvelles tables Iceberg uniquement

      Apache Icebergles tables converties à partir de Apache Parquet tables ne sont pas prises en charge.

    • Requêtes Time Travel

      AWS Clean Rooms ne prend pas en charge les requêtes de voyage dans le temps avec Apache Iceberg des tableaux.

    • Moteur Athena version 2

      Icebergles tables créées avec la version 2 du moteur Athena ne sont pas prises en charge.

    • Formats de fichiers

      Avroet les formats de fichier ORC (Optimized Row Columnar) ne sont pas pris en charge.

    • Compression

      ZstandardLa compression (Zstd) pour n'Parquetest pas prise en charge.

Types de données pris en charge pour les tables Iceberg

AWS Clean Rooms peut interroger Iceberg des tables contenant les types de données suivants :

  • boolean

  • date

  • decimal

  • double

  • float

  • int

  • list

  • long

  • map

  • string

  • struct

  • timestamp without time zone

Pour en savoir plus sur les types de données Iceberg, consultez Schemas for Iceberg dans la documentation Apache Iceberg.