MirrorMaker Bonnes pratiques de la 1.0 Avantages de MirrorMaker 2. *

Migration vers un cluster Amazon MSK

Le réplicateur Amazon MSK peut être utilisé pour la migration de clusters MSK. Consultez Qu'est-ce que le réplicateur Amazon MSK ?. Vous pouvez également utiliser Apache MirrorMaker 2.0 pour procéder à la migration d'un cluster non MSK vers un cluster Amazon MSK. Pour un exemple de la procédure à suivre, consultez Migrer un cluster Apache Kafka sur site vers Amazon MSK à l'aide de. MirrorMaker Pour plus d'informations sur son utilisation MirrorMaker, consultez la section Mise en miroir des données entre clusters dans la documentation d'Apache Kafka. Nous vous recommandons de l'installer MirrorMaker dans une configuration à haute disponibilité.

Présentation des étapes à suivre lors de l'utilisation MirrorMaker pour migrer vers un cluster MSK

Créez le cluster MSK de destination
Commencez MirrorMaker à partir d'une EC2 instance Amazon dans le même VPC Amazon que le cluster de destination.
Inspectez le MirrorMaker décalage.
Après le MirrorMaker rattrapage, redirigez les producteurs et les consommateurs vers le nouveau cluster à l'aide des courtiers bootstrap du cluster MSK.
Arrêter MirrorMaker.

MirrorMaker Bonnes pratiques de la 1.0

Cette liste de bonnes pratiques s'applique à la MirrorMaker version 1.0.

Exécutez MirrorMaker sur le cluster de destination. De cette façon, si un problème de réseau se produit, les messages sont toujours disponibles dans le cluster source. Si vous exécutez MirrorMaker sur le cluster source et que les événements sont mis en mémoire tampon dans le producteur et qu'il y a un problème réseau, les événements risquent d'être perdus.
Si le chiffrement est requis en transit, exécutez-le dans le cluster source.
Pour les consommateurs, définissez auto.commit.enabled=false
Pour les producteurs, définissez
- max.in.flight.requests.per.connection=1
- nouvelles tentatives=int.max_value
- acks=all
- max.block.ms = Long.Max_Value
Pour un rendement élevé du producteur :
- Les messages de tampon et les lots de messages de remplissage - ajustent buffer.memory, batch.size, linger.ms
- Ajustez les tampons de socket - receive.buffer.bytes, send.buffer.bytes
Pour éviter toute perte de données, désactivez la validation automatique à la source, afin de MirrorMaker pouvoir contrôler les validations, ce qu'elle fait généralement après avoir reçu le pack du cluster de destination. Si le producteur a acks=all et que le cluster de destination a min.insync.replicas défini sur plus de 1, les messages sont conservés sur plusieurs courtiers à la destination avant que le consommateur ne valide le décalage à la source. MirrorMaker
Si l'ordre est important, vous pouvez définir les nouvelles tentatives sur 0. Sinon, pour un environnement de production, définissez la valeur 1 maximum de connexions en transit pour vous assurer que les lots envoyés ne sont pas validés hors service si un lot échoue au milieu. De cette façon, chaque lot envoyé est réessayé jusqu'à ce que le lot suivant soit envoyé. Si max.block.ms n'est pas défini sur la valeur maximale et si le tampon du producteur est plein, il peut y avoir une perte de données (selon certains des autres paramètres). Cela peut bloquer le consommateur et lui envoyer une contre-pression.
Pour un débit élevé
- Augmentez buffer.memory.
- Augmentez la taille du lot.
- Ajustez linger.ms de façon à permettre aux lots de se remplir. Cela permet également une meilleure compression, moins d'utilisation de la bande passante réseau et moins de stockage sur le cluster. Cela se traduit par une rétention accrue.
- Surveillez l'utilisation du processeur et de la mémoire.
Pour un débit élevé pour les consommateurs
- Augmentez le nombre de threads/consommateurs par MirrorMaker processus.
- Augmentez d'abord le nombre de MirrorMaker processus sur les machines avant d'augmenter le nombre de threads pour garantir une haute disponibilité.
- Augmentez le nombre de MirrorMaker processus d'abord sur la même machine, puis sur différentes machines (avec le même identifiant de groupe).
- Isolez les sujets à très haut débit et utilisez des MirrorMaker instances distinctes.
Pour la gestion et la configuration
- Outils de gestion de l'utilisation AWS CloudFormation et de la configuration tels que Chef et Ansible.
- Utilisez des montages Amazon EFS pour garder tous les fichiers de configuration accessibles à partir de toutes les EC2 instances Amazon EFS.
- Utilisez des conteneurs pour faciliter le dimensionnement et la gestion des MirrorMaker instances.
En général, il faut plus d'un consommateur pour saturer un producteur. MirrorMaker Par conséquent, veillez à mettre en place plusieurs consommateurs. Tout d'abord, configurez-les sur différents ordinateurs pour fournir une haute disponibilité. Ensuite, mettez à l'échelle des ordinateurs individuels jusqu'à avoir un consommateur pour chaque partition, les consommateurs étant répartis également entre les ordinateurs.
Pour l'ingestion et la livraison à haut débit, ajustez les tampons de réception et d'envoi car leurs valeurs par défaut peuvent être trop faibles. Pour des performances optimales, assurez-vous que le nombre total de flux (num.streams) correspond à toutes les partitions de rubrique qui MirrorMaker tentent de copier vers le cluster de destination.

Avantages de MirrorMaker 2. *

Utilise le framework et l’écosystème d’Apache Kafka Connect.
Détecte les nouvelles rubriques et partitions.
Synchronise automatiquement la configuration des rubriques entre les clusters.
Prend en charge les paires de clusters « actifs/actifs », ainsi que n'importe quel nombre de clusters actifs.
Fournit de nouvelles mesures, notamment end-to-end la latence de réplication entre plusieurs centres de données et clusters.
Émet les décalages nécessaires pour migrer les consommateurs entre les clusters et fournit des outils pour la translation de décalage.
Prend en charge un fichier de configuration de haut niveau pour spécifier plusieurs clusters et flux de réplication en un seul endroit, par rapport aux propriétés producteur/consommateur de bas niveau pour chaque MirrorMaker processus 1.*.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Étiqueter les ressources à l'aide de

Migrer votre cluster Apache Kafka vers Amazon MSK