Récapitulatif Conditions préalables et limitations Architecture Outils Bonnes pratiques Épopées Ressources connexes Informations supplémentaires

Migrez un cluster Apache Kafka sur site vers Amazon MSK en utilisant MirrorMaker

Créée par Han Zhang (AWS) et Tanner Pratt (AWS)

Récapitulatif

Ce modèle fournit des conseils pour la migration d'un cluster Apache Kafka sur site, autogéré ou hébergé vers Amazon Managed Streaming for Apache Kafka (Amazon MSK). Vous pouvez également utiliser ce modèle pour migrer d'un cluster Amazon MSK à un autre.

Apache Kafka inclut MirrorMaker cette fonctionnalité qui réplique les données entre deux clusters Kafka. MirrorMaker consiste en un ensemble de consommateurs faisant partie d'un groupe de consommateurs. Les consommateurs lisent les données des rubriques du cluster source, puis transmettent ces données aux producteurs, qui les écrivent dans le cluster cible.

La documentation Amazon MSK contient une présentation détaillée du processus d'utilisation de la MirrorMaker version 1.0 pour migrer des clusters Kafka sur site vers Amazon MSK. Ce modèle complète ces informations en proposant des step-by-step instructions complètes pour l'utilisation de MirrorMaker la version 2.0.

Conditions préalables et limitations

Prérequis

Un compte AWS actif
Un cluster source Kafka qui est l'un des suivants :
- Dans un centre de données sur site
- Autogéré dans le cloud
- Hébergé par un partenaire

Limites

Pour utiliser MirrorMaker la version 2.0, le cluster source doit utiliser Apache Kafka version 2.4.0 ou ultérieure. Pour les versions antérieures, consultez les instructions de la documentation Amazon MSK afin d'utiliser la MirrorMaker version 1.0.

Versions du produit

MirrorMaker version 2.0
Apache Kafka version 2.4.0 ou ultérieure. Pour plus d'informations sur les versions d'Apache Kafka prises en charge par Amazon MSK, consultez la section Versions d'Apache Kafka prises en charge.

Architecture

Pile technologique source

Cluster Kafka sur site ou autogéré

Pile technologique cible

Cluster Amazon MSK

Architecture cible

MirrorMaker lit les données du cluster source et les réplique vers le cluster Amazon MSK cible

Le schéma montre le processus suivant :

MirrorMaker lit les données des sujets et des groupes de consommateurs du cluster Kafka source.
MirrorMaker réplique les données et les informations relatives aux consommateurs vers le cluster Amazon MSK cible.

Outils

Services AWS

Amazon Elastic Compute Cloud (Amazon EC2) fournit une capacité de calcul évolutive dans le cloud AWS. Vous pouvez lancer autant de serveurs virtuels que vous le souhaitez et les augmenter ou les diminuer rapidement.
Amazon Managed Streaming for Apache Kafka (Amazon MSK) est un service entièrement géré qui vous permet de créer et d'exécuter des applications utilisant Apache Kafka pour traiter les données de streaming.
Amazon Virtual Private Cloud (Amazon VPC) vous aide à lancer des ressources AWS dans un réseau virtuel que vous avez défini. Ce réseau virtuel ressemble à un réseau traditionnel que vous exploiteriez dans votre propre centre de données, avec les avantages liés à l'utilisation de l'infrastructure évolutive d'AWS.

Autres outils

Apache Kafka est une plateforme open source de streaming d'événements. Dans ce modèle, vous utilisez la MirrorMakerfonctionnalité de Kafka pour effectuer la migration entre clusters.

Bonnes pratiques

Vous pouvez MirrorMaker l'exécuter dans l'environnement source ou cible, mais il est recommandé de l'exécuter le plus près possible du cluster cible. Pour plus d'informations, consultez la section Meilleures pratiques : consommation à distance, production en local dans la documentation d'Apache Kafka.

Épopées

Tâche	Description	Compétences requises
Créez un VPC.	Créez un VPC dans le compte AWS cible. Pour obtenir des instructions, consultez la section Créer un VPC. Créez trois sous-réseaux privés dans différentes zones de disponibilité du nouveau VPC. Pour obtenir des instructions, consultez la section Création d'un sous-réseau. L'utilisation de différentes zones de disponibilité garantit une haute disponibilité et une tolérance aux pannes. Note Si vous utilisez une connexion Internet publique pour migrer le cluster Kafka, créez des sous-réseaux publics et activez l'accès public au cluster Amazon MSK.	Administrateur système AWS, DevOps ingénieur, administrateur du cloud
Créez le cluster Amazon MSK.	Créez un cluster Amazon MSK. Pour obtenir des instructions, consultez Création d'un cluster à l'aide de l'AWS Management Console ou Création d'un cluster à l'aide de l'AWS CLI. Configurez le cluster pour utiliser le VPC et les sous-réseaux que vous avez créés précédemment.	Administrateur système AWS, DevOps ingénieur, administrateur du cloud

Tâche	Description	Compétences requises
Installez MirrorMaker.	Lancez une EC2 instance. Connectez-vous à votre EC2 instance. Sur l' EC2 instance, téléchargez et extrayez la dernière version de Kafka. Pour obtenir des instructions, consultez Quick Start (documentation Kafka). Note Dans ce modèle, vous installez la MirrorMaker version 2.0 en tant que MirrorMaker cluster dédié sur une EC2 instance Amazon. Cette option est acceptable pour les environnements de développement et constitue l'approche utilisée dans ce modèle. Pour plus d'informations sur les autres options de déploiement pour la MirrorMaker version 2.0, consultez la section Informations supplémentaires de ce modèle.	Administrateur système AWS, administrateur cloud, DevOps ingénieur
Spécifiez les informations du cluster Kafka.	Dans le `bin` dossier d'installation du client Kafka, créez un fichier mm2.properties et configurez-le pour votre cluster Kafka source. Pour obtenir des instructions, consultez Exécuter un MirrorMaker cluster dédié (documentation Kafka).	Administrateur système AWS, administrateur cloud, DevOps ingénieur
Démarrez MirrorMaker.	Entrez la commande suivante pour démarrer MirrorMaker et transmettre le fichier mm2.properties. `$ ./bin/connect-mirror-maker.sh mm2.properties`	Administrateur système AWS, administrateur cloud, DevOps ingénieur
Surveillez les progrès.	Vérifiez la progression en vérifiant le décalage entre le dernier décalage pour chaque sujet et le décalage actuel pour le sujet MirrorMaker consommé. Pour obtenir des instructions, consultez la section Surveillance de la géoréplication dans la documentation de Kafka.	Administrateur système AWS, administrateur cloud, DevOps ingénieur

Tâche	Description	Compétences requises
Arrêtez les applications destinées aux consommateurs.	Arrêtez toutes les applications grand public qui consomment les données du cluster source.	Développeur d’applications
Démarrez les applications destinées aux consommateurs.	Modifiez la configuration du bootstrap de l'application pour qu'elle pointe vers le cluster de destination. Commencez ensuite à consommer sur le cluster cible.	Développeur d’applications
Arrêtez les producteurs du cluster source.	Lorsque les applications grand public sont consommées avec succès sur le cluster cible, arrêtez les producteurs sur le cluster source.	Développeur d’applications
Démarrez les producteurs sur le cluster cible.	Modifiez la configuration des serveurs bootstrap du producteur et pointez sur le cluster cible. Attendez la fin MirrorMaker de la mise en miroir de toutes les données du cluster source avant de démarrer les producteurs.	Développeur d’applications
Arrête MirrorMaker.	Une fois que les producteurs se sont déplacés vers le cluster cible, arrêtez MirrorMaker.	Administrateur système AWS, administrateur cloud, DevOps ingénieur

Ressources connexes

Ressources AWS

Migration de clusters à l'aide de MirrorMaker (documentation Amazon MSK)
Laboratoires de migration Amazon MSK (studio d'atelier AWS)

Autres ressources

MirrorMaker 2.0 (Propositions d'amélioration d'Apache Kafka)
Géo-réplication : mise en miroir des données entre clusters (documentation Apache Kafka)

Informations supplémentaires

Ce modèle s'exécute en MirrorMaker version 2.0 en tant que MirrorMaker cluster dédié sur Amazon EC2. Cette option est acceptable pour les environnements de développement. Bien que cela ne soit pas abordé dans ce modèle, vous pouvez également exécuter la MirrorMaker version 2.0 dans un cluster Kafka Connect. Cette option de déploiement utilise un framework au sein de l'écosystème Kafka qui améliore le dimensionnement et la maintenance. Vous déployez le connecteur dans un cluster Kafka Connect avec la configuration associée pour exécuter l'application. Le connecteur peut fonctionner en mode autonome pour le développement ou les tests ou en mode distribué pour la production. Pour plus d'informations, consultez Running MirrorMaker in a Connect cluster (documentation Apache Kafka). Pour plus d'informations sur les autres options de déploiement MirrorMaker 2.0, voir Procédure pas à pas : Running MirrorMaker 2.0 (documentation Kafka).

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Migrez Oracle Business Intelligence 12C vers le cloud AWS

Migrer une pile ELK vers le cloud AWS