Configuração de um domínio Multi-AZ - Amazon Elasticsearch Service

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configuração de um domínio Multi-AZ

Toda região da AWS é uma área geográfica distinta com vários locais isolados conhecidos como zonas de disponibilidade. Para evitar perda de dados e minimizar o tempo de inatividade do cluster no caso de uma interrupção de serviço, você pode distribuir os nós em duas ou três zonas de disponibilidade na mesma região, uma configuração conhecida como Multi-AZ.

Para domínios que executam cargas de trabalho de produção, recomendamos a seguinte configuração:

  • Escolha uma região que ofereça suporte a três zonas de disponibilidade com o Amazon ES.

  • Implante o domínio em três zonas.

  • Escolha tipos de instância da geração atual para os nós principais dedicados e nós de dados.

  • Use três nós principais dedicados e pelo menos três nós de dados.

  • Crie pelo menos uma réplica para cada índice no cluster.

O restante desta seção fornece explicações e contexto para estas recomendações.

Distribuição de estilhaços

Se habilitar Multi-AZ, você deverá ter pelo menos uma réplica para cada índice no cluster. Sem réplicas, o Amazon ES não pode distribuir cópias de seus dados para outras zonas de disponibilidade, o que, em grande parte, anula a finalidade de Multi-AZ. Felizmente, a configuração padrão para qualquer índice é uma contagem de réplica de 1. Como mostra o diagrama a seguir, o Amazon ES faz um melhor esforço para distribuir estilhaços primários e seus estilhaços de réplica correspondentes para diferentes zonas.

Além de distribuir os estilhaços por zona de disponibilidade, o Amazon ES os distribui por nó. Ainda assim, determinadas configurações de domínio podem resultar em contagens de estilhaços desequilibradas. Considere o seguinte domínio:

  • 5 nós de dados

  • 5 estilhaços principais

  • 2 réplicas

  • 3 zonas de disponibilidade

Nesta situação, o Amazon ES tem que sobrecarregar um nó para distribuir os estilhaços principais e de réplica entre as zonas, como mostrado no diagrama a seguir.

Para evitar esses tipos de situações, que podem sobrecarregar nós individuais e afetar o desempenho, recomendamos que você selecione uma contagem de instâncias que seja um múltiplo de três se você planeja ter duas ou mais réplicas por índice.

Distribuição de nó principal dedicado

Mesmo se você selecionar duas zonas de disponibilidade ao configurar seu domínio, o Amazon ES distribui automaticamente os nós principais dedicados em três zonas de disponibilidade. Essa distribuição ajuda a evitar tempo de inatividade do cluster se uma zona sofrer uma interrupção de serviço. Se você usar os três nós principais dedicados recomendados e uma zona de disponibilidade ficar inativa, seu cluster ainda terá um quorum (2) de nós principais dedicados e poderá selecionar um novo principal. O diagrama a seguir demonstra essa configuração.

Essa distribuição automática tem alguns exceções notáveis:

  • Se você escolher um tipo de instância de gerações anteriores que não esteja disponível nas três zonas de disponibilidade, os seguintes cenários se aplicam:

    • Se você escolher três zonas de disponibilidade para o domínio, o Amazon ES lançará um erro. Escolha um tipo de instância diferente e tente novamente.

    • Se você escolher duas zonas de disponibilidade para o domínio, o Amazon ES distribuirá os nós principais dedicados em duas zonas.

  • Nem todas as regiões da AWS tem três zonas de disponibilidade. Nessas Regiões, você só pode configurar um domínio para usar duas zonas (e o Amazon ES só pode distribuir os nós principais dedicados em duas zonas).

Interrupções na zona de disponibilidade

As interrupções na zona de disponibilidade são raras, mas ocorrem. A tabela a seguir relaciona diferentes configurações de Multi-AZ e comportamentos durante uma interrupção.

Número de zonas de disponibilidade em uma região Número de zonas de disponibilidade que você escolhe Número de nós principais dedicados Comportamento se uma zona de disponibilidade tiver uma interrupção
2 ou mais 2 0

Tempo de inatividade. Seu cluster perde metade dos seus nós de dados e deve substituir pelo menos um na zona de disponibilidade restante antes que possa escolher um principal.

2 2 3

50% de chance de tempo de inatividade. O Amazon ES distribui dois nós principais dedicados em uma zona de disponibilidade e um no outro:

  • Se a zona de disponibilidade com um nó principal dedicado tiver uma interrupção, os dois nós principais dedicados na zona de disponibilidade restante podem escolher um principal.

  • Se a zona de disponibilidade com dois nós principais dedicados tiver uma interrupção, o cluster ficará indisponível até que a zona de disponibilidade restante possa adicionar um nó principal dedicado escolher um principal.

3 ou mais 2 3

Não há tempo de inatividade. O Amazon ES distribui automaticamente os nós principais dedicados em três zonas de disponibilidade para que os dois nós principais dedicados restantes possam escolher um principal.

3 ou mais 3 0

Sem tempo de inatividade. Aproximadamente, dois terços dos seus nós de dados ainda estão disponíveis para escolher um principal.

3 ou mais 3 3

Sem tempo de inatividade. Os dois nós principais dedicados restantes podem escolher um principal.

Em todas as configurações, independentemente da causa, as falhas de nó podem fazer com que os nós de dados restantes do cluster passem por um período de aumento de carga enquanto o Amazon ES configura automaticamente novos nós para substituir os agora ausentes.

Por exemplo, no caso de uma falha na zona de disponibilidade em uma configuração de três zonas, dois terços dos nós de dados terão que processar várias solicitações para o cluster. Conforme eles processam essas solicitações, os nós restantes também estão replicando estilhaços para novos nós à medida que ficam online, o que pode afetar ainda mais o desempenho. Se a disponibilidade for essencial para sua carga de trabalho, considere a adição de recursos ao seu cluster para diminuir essa preocupação.

nota

O Amazon ES gerencia domínios Multi-AZ de forma transparente, para que não seja possível simular manualmente interrupções da zona de disponibilidade.