Configuration multi-source-replication pour Amazon RDS for My SQL - Amazon Relational Database Service

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configuration multi-source-replication pour Amazon RDS for My SQL

Avec la réplication multi-source, vous pouvez configurer une instance Amazon RDS for My SQL DB en tant que réplique qui reçoit les événements du journal binaire de plusieurs instances de base RDS de données My SQL source. La réplication multi-source est prise en charge RDS pour les instances My SQL DB exécutant les versions de moteur suivantes :

  • Versions mineures 8.0.35 et supérieures

  • Versions mineures 5.7.44 et supérieures

Pour plus d'informations sur Ma réplication SQL multi-source, voir Ma réplication SQL multi-source dans la section Ma SQL documentation. La SQL documentation My contient des informations détaillées sur cette fonctionnalité, tandis que cette rubrique décrit comment configurer et gérer les canaux de réplication multi-sources sur vos instances RDS for My SQL DB.

Cas d'utilisation de la réplication multi-sources

Les cas suivants sont de bons candidats pour l'utilisation de la réplication multi-source sur RDS for My SQL :

  • Applications qui doivent fusionner ou combiner plusieurs partitions sur des instances de base de données distinctes en une seule partition.

  • Applications devant générer des rapports à partir de données consolidées provenant de sources multiples.

  • Exigences relatives à la création de sauvegardes consolidées à long terme de données réparties entre plusieurs instances RDS de My SQL DB.

Conditions préalables à la réplication multi-sources

Avant de configurer la réplication multi-source, remplissez les conditions préalables suivantes.

  • Assurez-vous que les sauvegardes automatiques sont activées RDS pour chaque source de l'instance My SQL DB. L'activation des sauvegardes automatiques active la journalisation binaire. Pour savoir comment activer les sauvegardes automatiques, consultezActivation des sauvegardes automatiques.

  • Pour éviter les erreurs de réplication, nous vous recommandons de bloquer les opérations d'écriture sur les instances de base de données source. Vous pouvez le faire en définissant le read-only paramètre sur ON dans un groupe de paramètres personnalisé attaché à l'instance de base de données RDS for My SQL source. Vous pouvez utiliser le AWS Management Console ou le AWS CLI pour créer un nouveau groupe de paramètres personnalisés ou pour modifier un groupe existant. Pour plus d’informations, consultez Création d'un groupe de paramètres de base de données dans RDSAmazon et Modification des paramètres d'un groupe de paramètres de base de données dans Amazon RDS.

  • Pour chaque instance de base de données source, ajoutez l'adresse IP de l'instance au groupe de sécurité Amazon Virtual Private Cloud (VPC) pour l'instance de base de données multi-source. Pour identifier l'adresse IP d'une instance de base de données source, vous pouvez exécuter la commandedig RDS Endpoint. Exécutez la commande à partir d'une EC2 instance Amazon VPC identique à l'instance de base de données multi-source de destination.

  • Pour chaque instance de base de données source, utilisez un client pour vous connecter à l'instance de base de données et créez un utilisateur de base de données doté des privilèges requis pour la réplication, comme dans l'exemple suivant.

    CREATE USER 'repl_user' IDENTIFIED BY 'password'; GRANT REPLICATION CLIENT, REPLICATION SLAVE ON *.* TO 'repl_user';

Configuration des canaux de réplication multi-sources activés RDS pour les instances My SQL DB

La configuration de canaux de réplication à sources multiples est similaire à la configuration de la réplication à source unique. Pour la réplication multi-source, vous devez d'abord activer la journalisation binaire sur l'instance source. Vous importez ensuite les données des sources vers la réplique multi-sources. Ensuite, vous lancez la réplication à partir de chaque source en utilisant les coordonnées binaires du journal ou en utilisant le GTID positionnement automatique.

Pour configurer une instance RDS for My SQL DB en tant que réplique multi-source de deux instances My SQL DB ou plusRDS, effectuez les étapes suivantes.

Étape 1 : Importer les données des instances de base de données source vers la réplique multi-source

Effectuez les étapes suivantes sur chaque instance de base de données source.

Avant d'importer les données d'une source vers la réplique multi-source, déterminez le fichier journal binaire actuel et sa position en exécutant la SHOW MASTER STATUS commande. Prenez note de ces informations pour les utiliser à l'étape suivante. Dans cet exemple de sortie, le fichier mysql-bin-changelog.000031 et la position sont107.

File Position ----------------------------------- mysql-bin-changelog.000031 107 -----------------------------------

Copiez maintenant la base de données de l'instance de base de données source vers la réplique multi-source en utilisantmysqldump, comme dans l'exemple suivant.

mysqldump --databases database_name \ --single-transaction \ --compress \ --order-by-primary \ -u RDS_user_name \ -p RDS_password \ --host=RDS Endpoint | mysql \ --host=RDS Endpoint \ --port=3306 \ -u RDS_user_name \ -p RDS_password

Après avoir copié la base de données, vous pouvez définir le paramètre en lecture seule OFF sur l'instance de base de données source.

Étape 2 : démarrer la réplication depuis les instances de base de données source vers la réplique multi-source

Pour chaque instance de base de données source, utilisez les informations d'identification de l'utilisateur principal pour vous connecter à l'instance et exécutez les deux procédures stockées suivantes. Ces procédures stockées configurent la réplication sur un canal et démarrent la réplication. Cet exemple utilise le nom et la position du fichier binlog indiqués dans l'exemple de sortie de l'étape précédente.

CALL mysql.rds_set_external_source_for_channel('mysourcehost.example.com', 3306, 'repl_user', 'password', 'mysql-bin-changelog.000031', 107, 0, 'channel_1'); CALL mysql.rds_start_replication_for_channel('channel_1');

Pour plus d'informations sur l'utilisation de ces procédures stockées et d'autres pour configurer et gérer vos canaux de réplication, consultezGestion de la réplication multi-sources.

Utilisation de filtres avec réplication multi-sources

Vous pouvez utiliser des filtres de réplication pour spécifier les bases de données et les tables qui sont répliquées dans une réplique multi-sources. Les filtres de réplication peuvent inclure des bases de données et des tables dans la réplication ou les exclure de la réplication. Pour plus d'informations sur les filtres de réplication, consultezConfiguration des filtres de réplication avec My SQL.

Avec la réplication multi-sources, vous pouvez configurer les filtres de réplication globalement ou au niveau du canal. Le filtrage au niveau du canal n'est disponible qu'avec les instances de base de données prises en charge exécutant la version 8.0. Les exemples suivants montrent comment configurer les filtres globalement ou au niveau du canal.

Notez les exigences et le comportement suivants en matière de filtrage dans le cadre de la réplication multi-sources :

  • Les noms des chaînes doivent être placés entre guillemets (``).

  • Si vous modifiez les filtres de réplication dans le groupe de paramètres, les répliques multi-sources de tous les canaux mis à jour sont redémarrées sql_thread pour appliquer les modifications de manière dynamique. Si une mise à jour implique un filtre global, tous les canaux de réplication en cours d'exécution sont redémarrés.

  • Tous les filtres globaux sont appliqués avant les filtres spécifiques au canal.

  • Si un filtre est appliqué globalement et au niveau du canal, seul le filtre au niveau du canal est appliqué. Par exemple, si les filtres le sontreplicate_ignore_db="db1,`channel_22`:db2", le paramètre replicate_ignore_db défini sur db1 est appliqué à tous les canaux à l'exception dechannel_22, et channel_22 ignore uniquement les modifications dedb2.

Exemple 1 : définition d'un filtre global

Dans l'exemple suivant, la temp_data base de données est exclue de la réplication sur tous les canaux.

Dans Linux, macOS, ou Unix:

aws rds modify-db-parameter-group \ --db-parameter-group-name myparametergroup \ --parameters "ParameterName=replicate-ignore-db,ParameterValue='temp_data',ApplyMethod=immediate"

Exemple 2 : définition d'un filtre au niveau du canal

Dans l'exemple suivant, les modifications apportées à la sample22 base de données ne sont incluses que dans le canalchannel_22. De même, les modifications apportées à la sample99 base de données ne sont incluses que dans le canalchannel_99.

Dans Linux, macOS, ou Unix:

aws rds modify-db-parameter-group \ --db-parameter-group-name myparametergroup \ --parameters "ParameterName=replicate-do-db,ParameterValue='\`channel_22\`:sample22,\`channel_99\`:sample99',ApplyMethod=immediate"

Surveillance des canaux de réplication multi-sources

Vous pouvez surveiller des canaux individuels dans une réplique multi-sources en utilisant les méthodes suivantes :

  • Pour surveiller l'état de tous les canaux ou d'un canal spécifique, connectez-vous à la réplique multi-source et exécutez la SHOW REPLICA STATUS FOR CHANNEL 'channel_name' commande SHOW REPLICA STATUS or. Pour plus d'informations, consultez la section Vérification de l'état de réplication dans la section Ma SQL documentation.

  • Pour recevoir une notification lorsqu'un canal de réplication est démarré, arrêté ou supprimé, utilisez la notification d'RDSévénement. Pour de plus amples informations, veuillez consulter Utilisation des notifications d'RDSévénements Amazon.

  • Pour surveiller le décalage d'un canal spécifique, vérifiez la ReplicationChannelLag métrique correspondante. Les points de données pour cette métrique ont une période de 60 secondes (1 minute) et sont disponibles pendant 15 jours. Pour déterminer le décalage d'un canal de réplication, utilisez l'identifiant de l'instance et le nom du canal de réplication. Pour recevoir une notification lorsque ce décalage dépasse un certain seuil, vous pouvez configurer une CloudWatch alarme. Pour de plus amples informations, veuillez consulter Surveillance des métriques RDS avec Amazon CloudWatch.

Considérations et bonnes pratiques relatives à la réplication multi-sources

Avant d'utiliser la réplication multi-source sur RDS for MySQL, passez en revue les considérations et les meilleures pratiques suivantes :

  • Assurez-vous qu'une instance de base de données configurée en tant que réplique multi-source dispose de ressources suffisantes, telles que le débit, la mémoireCPU, et qu'elle permet de IOPS gérer la charge de travail provenant de plusieurs instances sources.

  • Surveillez régulièrement l'utilisation des ressources sur votre réplique multi-source et ajustez la configuration du stockage ou de l'instance pour gérer la charge de travail sans surcharger les ressources.

  • Vous pouvez configurer la réplication multithread sur une réplique multi-source en définissant la variable système sur une valeur replica_parallel_workers supérieure à. 0 Dans ce cas, le nombre de threads alloués à chaque canal est la valeur de cette variable, plus un thread coordinateur pour gérer les threads applicateurs.

  • Configurez les filtres de réplication de manière appropriée pour éviter les conflits. Pour répliquer une base de données complète vers une autre base de données sur un réplica, vous pouvez utiliser --replicate-rewrite-db cette option. Par exemple, vous pouvez répliquer toutes les tables de la base de données A vers la base de données B sur une instance de réplication. Cette approche peut être utile lorsque toutes les instances source utilisent la même convention de dénomination de schéma. Pour plus d'informations sur --replicate-rewrite-db cette option, consultez la section Options et variables du serveur de réplication dans la section Ma SQL documentation.

  • Pour éviter les erreurs de réplication, évitez d'écrire sur le réplica. Nous vous recommandons d'activer le read_only paramètre sur les répliques multi-sources pour bloquer les opérations d'écriture. Cela permet d'éliminer les problèmes de réplication causés par des opérations d'écriture contradictoires.

  • Pour améliorer les performances des opérations de lecture telles que les tris et les jointures à charge élevée exécutées sur la réplique multi-source, pensez à utiliser des lectures RDS optimisées. Cette fonctionnalité peut être utile pour les requêtes qui dépendent de grandes tables temporaires ou de fichiers de tri. Pour de plus amples informations, veuillez consulter Amélioration des performances des requêtes pour RDS for MySQL avec Amazon RDS Optimized Reads.

  • Pour minimiser le délai de réplication et améliorer les performances d'une réplique multi-sources, pensez à activer les écritures optimisées. Pour de plus amples informations, veuillez consulter Amélioration des performances d'écriture avec Écritures optimisées pour RDS for MySQL.

  • Effectuez des opérations de gestion (telles que la modification de la configuration) sur un canal à la fois et évitez de modifier plusieurs canaux à partir de plusieurs connexions. Ces pratiques peuvent entraîner des conflits dans les opérations de réplication. Par exemple, l'exécution simultanée rds_skip_repl_error_for_channel de rds_start_replication_for_channel procédures à partir de plusieurs connexions peut entraîner l'omission d'événements sur un canal différent de celui prévu.

  • Vous pouvez activer les sauvegardes sur une instance de réplication multi-sources et exporter les données de cette instance vers un compartiment Amazon S3 afin de les stocker à des fins de long terme. Cependant, il est également important de configurer les sauvegardes avec une rétention appropriée sur les instances sources individuelles. Pour plus d'informations sur l'exportation de données de capture d'écran vers Amazon S3, consultezExportation de données instantanées de base de données vers Amazon S3 pour Amazon RDS.

  • Pour répartir la charge de travail de lecture sur un réplica multi-source, vous pouvez créer des répliques de lecture à partir d'un réplica multi-sources. Vous pouvez localiser ces répliques de lecture de différentes manières en Régions AWS fonction des exigences de votre application. Pour plus d'informations sur les réplicas en lecture, consultez Travailler avec les répliques de My SQL read.

Limitations relatives à la réplication multi-sources sur RDS for My SQL

Les limites suivantes s'appliquent à la réplication multi-source sur RDS for My SQL :

  • Actuellement, RDS for My SQL prend en charge la configuration d'un maximum de 15 canaux pour une réplique multi-sources.

  • Une instance de réplication en lecture ne peut pas être configurée en tant que réplique multi-source.

  • Pour configurer la réplication multi-source sur RDS My SQL Running Engine version 5.7, le schéma de performance doit être activé sur l'instance de réplication. L'activation du schéma de performance est facultative sur RDS My SQL Running Engine version 8.0.

  • RDSPour My SQL Running Engine version 5.7, les filtres de réplication s'appliquent à tous les canaux de réplication. RDSPour My SQL Running Engine version 8.0, vous pouvez configurer des filtres qui s'appliquent à tous les canaux de réplication ou à des canaux individuels.

  • La restauration d'un RDS instantané ou l'exécution d'un Point-in-time-Restore (PITR) ne restaurent pas les configurations de canaux de réplication multi-sources.

  • Lorsque vous créez une réplique en lecture d'une réplique multi-source, elle ne réplique que les données de l'instance multi-source. Il ne restaure aucune configuration de canal.

  • Je SQL ne suis pas favorable à la configuration d'un nombre différent de travailleurs parallèles pour chaque canal. Chaque canal reçoit le même nombre de travailleurs parallèles en fonction de la replica_parallel_workers valeur.

Les limitations supplémentaires suivantes s'appliquent si votre cible de réplication multi-source est un cluster de base de données multi-AZ :

  • Un canal doit être configuré pour une source RDS pour My SQL instance avant toute écriture sur cette instance.

  • La réplication GTID basée sur chaque source RDS de My SQL instance doit être activée.

  • Un événement de basculement sur le cluster de base de données supprime la configuration de réplication multi-source. La restauration de cette configuration nécessite de répéter les étapes de configuration.