Résolution des problèmes liés aux intégrations zéro ETL d'Aurora à Amazon Redshift - Amazon Aurora

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Résolution des problèmes liés aux intégrations zéro ETL d'Aurora à Amazon Redshift

Vous pouvez vérifier l'état d'une intégration zéro ETL en interrogeant la table système SVV_INTEGRATION dans Amazon Redshift. Si la valeur de la colonne state est ErrorState, cela signifie que quelque chose ne va pas. Pour plus d’informations, consultez Surveillance des intégrations à l'aide des tables système.

Utilisez les informations suivantes pour résoudre les problèmes courants liés aux intégrations zéro ETL d'Aurora à Amazon Redshift.

Je ne parviens pas à créer une intégration zéro ETL

Si vous ne pouvez pas créer une intégration zéro ETL, assurez-vous que les points suivants sont corrects pour votre cluster de base de données source :

  • Le cluster source exécute MySQL version 3.05 (compatible avec MySQL 8.0.32) ou supérieure, ou Aurora PostgreSQL (compatible avec PostgreSQL 15.4 et Zero-ETL Support). Pour valider la version du moteur, choisissez l'onglet Configuration du cluster et vérifiez la version du moteur.

  • Vous avez correctement configuré les paramètres du cluster de base de données. Si les paramètres requis ne sont pas définis correctement ou ne sont pas associés au cluster, la création échoue. veuillez consulter Étape 1 : Créer un groupe de paramètres de cluster de base de données personnalisé.

En outre, assurez-vous que les informations suivantes sont correctes pour votre entrepôt de données cible :

Mon intégration est bloquée dans un état de Syncing

Il est possible que votre intégration affiche systématiquement le statut Syncing si vous modifiez la valeur de l'un des paramètres de base de données requis.

Pour résoudre ce problème, vérifiez les valeurs des paramètres du groupe de paramètres associé au cluster de bases de données de source et assurez-vous qu'elles correspondent aux valeurs requises. Pour plus d’informations, consultez Étape 1 : Créer un groupe de paramètres de cluster de base de données personnalisé.

Si vous modifiez des paramètres, veillez à redémarrer le cluster pour appliquer les modifications.

Mes tables ne sont pas répliquées sur Amazon Redshift

Vos données ne sont peut-être pas répliquées car une ou plusieurs de vos tables sources ne possèdent pas de clé primaire. Le tableau de bord de surveillance d'Amazon Redshift affiche l'état de ces tables au fur Failed et à mesure que l'état de l'intégration Zero-ETL globale passe à. Needs attention

Pour résoudre ce problème, vous pouvez identifier une clé existante dans votre table qui peut devenir une clé primaire, ou vous pouvez ajouter une clé primaire synthétique. Pour des solutions détaillées, consultez . les ressources suivantes :

Une ou plusieurs de mes tables Amazon Redshift nécessitent une resynchronisation

L'exécution de certaines commandes sur votre cluster de base de données source peut nécessiter la resynchronisation de vos tables. Dans ce cas, la vue système SVV_INTEGRATION_TABLE_STATE affiche un table_state de ResyncRequired, ce qui signifie que l'intégration doit complètement recharger les données de cette table spécifique depuis MySQL vers Amazon Redshift.

Lorsque la table commence à se resynchroniser, elle passe à l'état Syncing. Aucune action manuelle n'est requise pour resynchroniser une table. Pendant la resynchronisation des données des tables, vous ne pouvez pas y accéder dans Amazon Redshift.

Vous trouverez ci-dessous quelques exemples d'opérations permettant de mettre une table dans un état ResyncRequired et les alternatives possibles à envisager.

Opération Exemple Autrement
Ajout d'une colonne à une position spécifique
ALTER TABLE table_name ADD COLUMN column_name INTEGER NOT NULL first;
Amazon Redshift ne prend pas en charge l'ajout de colonnes à des positions spécifiques à l'aide des mots clés first et after. Si l'ordre des colonnes de la table cible n'est pas critique, ajoutez la colonne à la fin de la table à l'aide d'une commande plus simple :
ALTER TABLE table_name ADD COLUMN column_name column_type;
Ajout d'une colonne d'horodatage avec la valeur par défaut de CURRENT_TIMESTAMP
ALTER TABLE table_name ADD COLUMN column_name TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP;
La CURRENT_TIMESTAMP valeur des lignes de table existantes est calculée par et ne peut pas être simulée dans Amazon Redshift sans resynchronisation complète des données de table.

Si possible, remplacez la valeur par défaut par une constante littérale comme 2023-01-01 00:00:15 afin d'éviter toute latence dans la disponibilité de la table.

Réalisation d'opérations sur plusieurs colonnes au sein d'une seule commande
ALTER TABLE table_name ADD COLUMN column_1, RENAME COLUMN column_2 TO column_3;
Envisagez de diviser la commande en deux opérations distinctes, ADD et RENAME, qui ne nécessiteront pas de resynchronisation.