Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Récapitulatif des options de migration
Ce tableau récapitule les principales caractéristiques et considérations relatives à chaque option de migration.
Fonctionnalité |
Migration sur place |
Migration sur place |
Migration complète des données |
---|---|---|---|
Améliorations de la mise en page des données dans le cadre du processus de migration |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Formats de fichiers pris en charge |
Parquet, Avro, ORC |
Parquet, Avro, ORC |
Parquet, Avro, ORC, JSON, CSV |
Remplacement de la table source par une table Iceberg |
(crée une nouvelle table, mais avec des étapes supplémentaires, vous pouvez remplacer la table source) |
(crée une table de sauvegarde et remplace la table source par une table Iceberg) |
(crée une nouvelle table) |
Impact sur le tableau source |
|||
|
Corrige la table source |
Corrige la table de sauvegarde |
Sûr, source non affectée |
Impact de la table Iceberg |
|||
|
Corruption de la table Iceberg |
Corruption de la table Iceberg |
Aucun impact sur la table Iceberg |
|
Non visible sur le nouveau tableau (besoin d'intégrer une partition avec |
Non visible sur le nouveau tableau (besoin d'intégrer une partition avec |
Non visible sur le nouveau tableau (besoin de |
Coût |
Faible |
Faible |
Plus élevé (réécriture complète des données) |
Vitesse de migration |
Rapide |
Rapide |
Plus lent |
Peut être utilisé pour migrer vers Amazon S3 Tables |
|
|
|
Nécessite un DDL manuel |
(le schéma et les partitions sont copiés depuis la table source) |
(le schéma et les partitions sont copiés depuis la table source) |
Si vous utilisez le CTAS, il suffit de spécifier le partitionnement |
Meilleure utilisation |
Migration rapide sans réécriture des données, ce qui permet d' side-by-sideutiliser Hive et Iceberg à des fins de test ou de transition progressive. |
Remplacer une table Hive en place sans réécrire les données, lorsqu'un changement immédiat est acceptable. |
Optimisation complète d'Iceberg avec réécriture des données. Idéal pour redessiner des partitions ou des schémas, ou pour améliorer la mise en page et les performances. Toujours recommandé si possible. |