Récapitulatif des options de migration - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Récapitulatif des options de migration

Ce tableau récapitule les principales caractéristiques et considérations relatives à chaque option de migration.

Fonctionnalité

Migration sur place

instantané

Migration sur place

migrate

Migration complète des données

CTAS ou (CRÉER UN TABLEAU + INSÉRER)

Améliorations de la mise en page des données dans le cadre du processus de migration

  • Re-trier les données

Non

Non

Oui

  • Modifier le partitionnement (par exemple, pour utiliser le partitionnement caché d'Iceberg)

Non

Non

Oui

  • Modifier le schéma de table

Non

Non

Oui

  • Optimisation de la taille du fichier

Non

Non

Oui

  • Valider le schéma des données existantes avant d'ajouter les données

Non

Non

Oui

Formats de fichiers pris en charge

Parquet, Avro, ORC

Parquet, Avro, ORC

Parquet, Avro, ORC, JSON, CSV

Remplacement de la table source par une table Iceberg

Non

(crée une nouvelle table, mais avec des étapes supplémentaires, vous pouvez remplacer la table source)

Oui

(crée une table de sauvegarde et remplace la table source par une table Iceberg)

Non

(crée une nouvelle table)

Impact sur le tableau source

  • Opérations de suppression de fichiers sur la table Iceberg (expire_snapshot opérations, suppression d'une table avec purge)

Corrige la table source

Corrige la table de sauvegarde

Sûr, source non affectée

Impact de la table Iceberg

  • Impact si les fichiers de la table source sont supprimés

Corruption de la table Iceberg

Corruption de la table Iceberg

Aucun impact sur la table Iceberg

  • Impact si de nouveaux fichiers sont ajoutés à l'emplacement de la table source

Non visible sur le nouveau tableau

(besoin d'intégrer une partition avecadd_files)

Non visible sur le nouveau tableau

(besoin d'intégrer une partition avecadd_files)

Non visible sur le nouveau tableau

(besoin de INSERT INTO la nouvelle table)

Coût

Faible

Faible

Plus élevé (réécriture complète des données)

Vitesse de migration

Rapide

Rapide

Plus lent

Peut être utilisé pour migrer vers Amazon S3 Tables

Non

Non

Oui

Nécessite un DDL manuel

Non

(le schéma et les partitions sont copiés depuis la table source)

Non

(le schéma et les partitions sont copiés depuis la table source)

Si vous utilisez le CTAS, il suffit de spécifier le partitionnement

Meilleure utilisation

Migration rapide sans réécriture des données, ce qui permet d' side-by-sideutiliser Hive et Iceberg à des fins de test ou de transition progressive.

Remplacer une table Hive en place sans réécrire les données, lorsqu'un changement immédiat est acceptable.

Optimisation complète d'Iceberg avec réécriture des données. Idéal pour redessiner des partitions ou des schémas, ou pour améliorer la mise en page et les performances. Toujours recommandé si possible.