Configuration d'un domaine multi-AZ dans Amazon Service OpenSearch - Amazon OpenSearch Service

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configuration d'un domaine multi-AZ dans Amazon Service OpenSearch

Pour éviter les pertes de données et minimiser les interruptions de OpenSearch service du cluster Amazon Service en cas d'interruption de service, vous pouvez répartir les nœuds sur deux ou trois zones de disponibilité de la même région, selon une configuration connue sous le nom de Multi-AZ. Les zones de disponibilité sont des emplacements isolés au sein de chaque AWS région.

Pour les domaines qui exécutent des charges de travail de production, nous recommandons l'option de déploiement Multi-AZ avec veille, qui crée la configuration suivante :

  • Le domaine est déployé sur trois zones.

  • Types d'instances de génération actuelle pour les nœuds maîtres et les nœuds de données dédiés.

  • Trois nœuds maîtres dédiés et trois nœuds de données (ou un multiple de trois).

  • Au moins deux répliques pour chaque index de votre domaine, ou un multiple de trois copies de données (y compris les nœuds principaux et les répliques).

Le reste de cette section fournit des explications et le contexte de ces configurations.

Multi-AZ avec mode veille

Multi-AZ with Standby est une option de déploiement pour les domaines Amazon OpenSearch Service qui offre une disponibilité de 99,99 %, des performances constantes pour les charges de travail de production, ainsi qu'une configuration et une gestion de domaines simplifiées. Lorsque vous utilisez le mode Multi-AZ en mode veille, les domaines résistent aux défaillances de l'infrastructure, sans aucun impact sur les performances ou la disponibilité. Cette option de déploiement répond à cette norme en imposant un certain nombre de bonnes pratiques, telles que le nombre de nœuds de données spécifié, le nombre de nœuds principaux, le type d'instance, le nombre de répliques, les paramètres de mise à jour logicielle et l'activation du réglage automatique.

Lorsque vous utilisez Multi-AZ avec Standby, le OpenSearch service crée un domaine dans trois zones de disponibilité, chaque zone contenant une copie complète des données et les données étant réparties de manière égale dans chacune des zones. Votre domaine réserve des nœuds dans l'une de ces zones en attente, ce qui signifie qu'ils ne répondent pas aux demandes de recherche. Lorsque le OpenSearch Service détecte une défaillance dans l'infrastructure sous-jacente, il active automatiquement les nœuds de secours en moins d'une minute. Le domaine continue de traiter les demandes d'indexation et de recherche, et tout impact est limité au temps nécessaire pour effectuer le basculement. Il n'y a aucune redistribution des données ou des ressources, ce qui n'affecte pas les performances du cluster et aucun risque de dégradation de la disponibilité. Le mode Multi-AZ avec mode veille est disponible sans frais supplémentaires.

Deux options s'offrent à vous pour créer un domaine en mode veille activé sur le AWS Management Console. Tout d'abord, vous pouvez créer un domaine à l'aide de la méthode de création Easy create, et le OpenSearch service utilisera automatiquement une configuration prédéterminée, qui inclut les éléments suivants :

  • Trois zones de disponibilité, dont l'une fait office de veille

  • Trois nœuds principaux et nœuds de données dédiés

  • Auto-Tune activé sur le domaine

  • Stockage GP3 pour les nœuds de données

Vous pouvez également choisir la méthode de création standard et sélectionner le domaine avec veille comme option de déploiement. Cela vous permet de personnaliser votre domaine tout en imposant les principales fonctionnalités de veille, telles que trois zones et trois nœuds principaux. Nous vous recommandons de choisir un nombre de nœuds de données multiple de trois (le nombre de zones de disponibilité).

Une fois que vous avez créé votre domaine, vous pouvez accéder aux pages de détails du domaine et, dans l'onglet Configuration du cluster, vérifier que 3-AZ avec veille apparaît sous Zone (s) de disponibilité.

Si vous rencontrez des problèmes lors de la migration d'un domaine existant vers le mode Multi-AZ avec veille, consultez la section Erreur lors de la migration vers le mode Multi-AZ avec mode veille dans le guide de dépannage.

Limites

Lorsque vous configurez un domaine avec Multi-AZ avec mode veille, tenez compte des limites suivantes :

  • Le nombre total de partitions sur un nœud ne peut pas dépasser 1 000, le nombre total de partitions sur un cluster ne peut pas dépasser 75 000 et la taille d'une seule partition ne peut pas dépasser 65 Go.

  • Le mode Multi-AZ avec veille ne fonctionne qu'avec les types d'i3instance m5 c5 r5 r6gc6g,m6g,,, r6gd et. Pour plus d'informations sur les instances prises en charge, consultez la section Types d'instances pris en charge.

  • Vous ne pouvez utiliser qu'un SSD IOPS provisionné, un SSD à usage général (GP3) ou un stockage sauvegardé par instance avec mode veille.

  • Si vous l'activez UltraWarmsur un domaine Multi-AZ avec veille, le nombre de nœuds chauds doit être un multiple du nombre de zones de disponibilité utilisées.

Multi-AZ sans mode veille

OpenSearch Le service prend toujours en charge le mode multi-AZ sans mode veille, ce qui offre une disponibilité de 99,9 %. Les nœuds sont répartis entre les zones de disponibilité, et la disponibilité dépend du nombre de zones de disponibilité et de copies des données. Alors qu'avec le mode veille, vous devez configurer votre domaine selon les meilleures pratiques, sans mode veille, vous pouvez choisir votre propre nombre de zones de disponibilité, de nœuds et de répliques. Nous ne recommandons pas cette option, sauf si vous avez des flux de travail existants qui seraient perturbés par la création de domaines en veille.

Si vous choisissez cette option, nous vous recommandons tout de même de sélectionner trois zones de disponibilité afin de rester résilient aux défaillances des nœuds, des disques et des défaillances mono-AZ. En cas de panne, le cluster redistribue les données entre les ressources restantes afin de maintenir la disponibilité et la redondance. Ce mouvement de données augmente l'utilisation des ressources sur le cluster et peut avoir un impact sur les performances. Si le cluster n'est pas correctement dimensionné, sa disponibilité peut se dégrader, ce qui va largement à l'encontre de l'objectif du Multi-AZ.

La seule façon de configurer un domaine sans veille sur le AWS Management Console est de choisir la méthode de création standard et de sélectionner Domaine sans veille comme option de déploiement.

Répartition des partitions

Si vous activez le mode Multi-AZ sans mode veille, vous devez créer au moins une réplique pour chaque index de votre cluster. Sans répliques, le OpenSearch Service ne peut pas distribuer de copies de vos données vers d'autres zones de disponibilité. Heureusement, la configuration par défaut pour n'importe quel index est un nombre de réplica de 1. Comme le montre le schéma suivant, OpenSearch Service fait de son mieux pour distribuer les partitions principales et leurs répliques correspondantes dans différentes zones.

Diagram showing three Availability Zones, each with primary and replica shards distributed across them.

Outre la distribution des partitions par zone de disponibilité, OpenSearch Service les distribue par nœud. Toutefois, certaines configurations de domaine peuvent créer des nombres de partitions déséquilibrés. Prenons l'exemple de domaine suivant :

  • 5 nœuds de données

  • 5 partitions principales

  • 2 réplicas

  • 3 zones de disponibilité

Dans ce cas, le OpenSearch service doit surcharger un nœud afin de distribuer les partitions principales et répliques entre les zones, comme indiqué dans le schéma suivant.

Diagram showing distribution of primary and replica shards across three availability zones.

Pour éviter ce type de situation, qui peut mettre à rude épreuve des nœuds individuels et nuire aux performances, nous vous recommandons de choisir le mode Multi-AZ avec mode veille, ou de choisir un nombre d'instances multiple de trois lorsque vous prévoyez d'avoir deux répliques ou plus par index.

Répartition des nœuds principaux dédiés

Même si vous sélectionnez deux zones de disponibilité lors de la configuration de votre domaine, le OpenSearch service distribue automatiquement des nœuds maîtres dédiés sur trois zones de disponibilité. Cette distribution permet d'éviter les temps d'arrêt du cluster si une zone subit une interruption de service. Si vous utilisez les trois nœuds principaux dédiés recommandés et qu'une zone de disponibilité tombe en panne, votre cluster dispose encore d'un quorum (2) des nœuds principaux dédiés et peut choisir un nouveau maître. Le schéma suivant illustre cette configuration.

Diagram showing distribution of primary and replica nodes across three Availability Zones.

Si vous choisissez un type d'instance d'une génération plus ancienne qui n'est pas disponible dans trois zones de disponibilité, les scénarios suivants s'appliquent :

  • Si vous avez choisi trois zones de disponibilité pour le domaine, le OpenSearch service génère une erreur. Choisissez un type d'instance différent, puis réessayez.

  • Si vous avez choisi deux zones de disponibilité pour le domaine, le OpenSearch service distribue les nœuds maîtres dédiés sur deux zones.

Interruptions des zones de disponibilité

Ces interruptions sont rares, mais peuvent arriver. Le tableau suivant répertorie les différentes configurations et comportements Multi-AZ lors d'une interruption. La dernière ligne du tableau s'applique au mode multi-AZ avec mode veille, tandis que toutes les autres lignes ont des configurations qui ne s'appliquent qu'au mode multi-AZ sans mode veille.

Nombre de zones de disponibilité dans une région Nombre de zones de disponibilité que vous avez choisies Nombre de nœuds principaux dédiés Comportement si une zone de disponibilité subit une interruption
2 ou plus 2 0

Temps d'arrêt. Votre cluster perd la moitié de ses nœuds de données et doit en remplacer au moins un dans les autres zones de disponibilité avant de pouvoir choisir un maître.

2 2 3

50 % de chances d'indisponibilité. OpenSearch Le service distribue deux nœuds maîtres dédiés dans une zone de disponibilité et l'un dans l'autre :

  • Si la zone de disponibilité à un nœud principal dédié subit une interruption, les deux nœuds principaux dédiés dans la zone restante peuvent choisir un maître.

  • Si la zone de disponibilité à deux nœuds principaux dédiés subit une interruption, le cluster est indisponible jusqu'à ce que la zone restante soit rétablie.

3 ou plus 2 3

Pas de temps d'arrêt. OpenSearch Le service distribue automatiquement les nœuds maîtres dédiés sur trois zones de disponibilité, de sorte que les deux nœuds principaux dédiés restants peuvent élire un maître.

3 ou plus 3 0

Pas de temps d'arrêt. Environ deux tiers de vos nœuds de données sont toujours disponibles pour choisir un maître.

3 ou plus 3 3

Pas de temps d'arrêt. Les deux autres nœuds principaux dédiés peuvent choisir un maître.

Dans toutes les configurations, quelle qu'en soit la cause, les défaillances de nœuds peuvent entraîner une période de charge accrue sur les nœuds de données restants du cluster, tandis que le OpenSearch service configure automatiquement de nouveaux nœuds pour remplacer les nœuds actuellement manquants.

Par exemple, en cas de défaillance d'une zone de disponibilité dans une configuration à trois zones, les deux tiers des nœuds de données doivent traiter le même nombre de requêtes dans le cluster. À mesure qu'ils traitent ces requêtes, les nœuds restants répliquent également des partitions sur de nouveaux nœuds au fur et à mesure qu'ils apparaissent en ligne, ce qui peut affecter d'autant plus les performances. Si la disponibilité est essentielle pour votre charge de travail, nous vous conseillons d'ajouter des ressources à votre cluster pour atténuer ce soucis.

Note

OpenSearch Le service gère les domaines multi-AZ de manière transparente, de sorte que vous ne pouvez pas simuler manuellement les perturbations des zones de disponibilité.