Configurando um domínio Multi-AZ no Amazon Service OpenSearch - OpenSearch Serviço Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configurando um domínio Multi-AZ no Amazon Service OpenSearch

Para evitar a perda de dados e minimizar o tempo de inatividade do cluster Amazon OpenSearch Service em caso de interrupção do serviço, você pode distribuir nós em duas ou três zonas de disponibilidade na mesma região, uma configuração conhecida como Multi-AZ. As zonas de disponibilidade são locais isolados em cada AWS região.

Para domínios que executam workloads de produção, recomendamos a opção de implantação multi-AZ com modo de espera, que cria a seguinte configuração:

  • Domínio implementado em três zonas.

  • Tipos de instância da geração atual para os nós principais dedicados e nós de dados.

  • Três nós principais dedicados e três (ou um múltiplo de três) nós de dados.

  • Pelo menos duas réplicas para cada índice no seu domínio ou um múltiplo de três cópias de dados (incluindo nós primários e réplicas).

O restante desta seção fornece explicações e contexto para estas configurações.

Multi-AZ com modo de espera

O Multi-AZ with Standby é uma opção de implantação para domínios do Amazon OpenSearch Service que oferece disponibilidade de 99,99%, desempenho consistente para cargas de trabalho de produção e configuração e gerenciamento simplificados de domínio. Quando você usa o multi-AZ com modo de espera, os domínios são resilientes a falhas de infraestrutura, sem impacto no desempenho ou na disponibilidade. Essa opção de implantação atinge esse padrão ao exigir várias práticas recomendadas, como uma contagem especificada de nós de dados, contagem de nós principais, tipo de instância, contagem de réplicas, configurações de atualização de software e ajuste automático ativado.

Quando você usa o Multi-AZ com o Standby, o OpenSearch Service cria um domínio em três zonas de disponibilidade, com cada zona contendo uma cópia completa dos dados e com os dados distribuídos igualmente em cada uma das zonas. Seu domínio reserva nós em uma dessas zonas como modo de espera, o que significa que eles não atendem a solicitações de pesquisa. Quando o OpenSearch Serviço detecta uma falha na infraestrutura subjacente, ele ativa automaticamente os nós em espera em menos de um minuto. O domínio continua atendendo às solicitações de indexação e pesquisa, e qualquer impacto é limitado ao tempo necessário para realizar o failover. Não há redistribuição de dados ou recursos, o que resulta em desempenho inalterado do cluster e sem risco de redução da disponibilidade. O multi-AZ com modo de espera está disponível sem custo adicional.

Você tem duas opções para criar um domínio com modo de espera no AWS Management Console. Primeiro, você pode criar um domínio com o método de criação fácil, e o OpenSearch Serviço usará automaticamente uma configuração predeterminada, que inclui o seguinte:

  • Três zonas de disponibilidade, com uma atuando como reserva

  • Três nós principais e nós de dados dedicados

  • Ajuste automático ativado no domínio

  • Armazenamento GP3 para os nós de dados

Você também pode escolher o método Criação padrão e selecionar Domínio com modo de espera como sua opção de implantação. Isso permite que você personalize seu domínio e, ao mesmo tempo, exija os principais atributos do modo de espera, como três zonas e três nós principais. Recomendamos escolher uma contagem de nós de dados que seja múltipla de três (o número de zonas de disponibilidade).

Depois de criar seu domínio, você pode navegar até as páginas de detalhes do domínio e, na guia Configuração do cluster, confirmar se 3-AZ com espera aparece em Zona(s) de Disponibilidade.

Se você tiver problemas ao migrar um domínio existente para o multi-AZ com modo de espera, consulte Erro ao migrar para o multi-AZ com modo de espera no guia de solução de problemas.

Limitações

Ao configurar um domínio com multi-AZ com modo de espera, considere as seguintes limitações:

  • O número total de fragmentos em um nó não pode exceder 1.000, o número total de fragmentos em um cluster não pode exceder 75.000 e o tamanho de um único fragmento não pode exceder 65 GB.

  • O multi-AZ com modo de espera funciona somente com os tipos de instância m5, c5, r5, r6g, c6g, m6g, r6gd e i3. Para obter mais informações sobre instâncias compatíveis, consulte Tipos de instância compatíveis.

  • Você só pode usar SSD de IOPs provisionadas, SSD de uso geral (GP3) ou armazenamento baseado em instância com modo de espera.

  • Se você habilitar UltraWarmem um domínio Multi-AZ com Standby, o número de nós quentes deverá ser um múltiplo do número de zonas de disponibilidade que estão sendo usadas.

Multi-AZ sem modo de espera

OpenSearch O serviço ainda oferece suporte ao Multi-AZ sem o modo de espera, o que oferece 99,9% de disponibilidade. Os nós são distribuídos em zonas de disponibilidade, e a disponibilidade depende do número de zonas de disponibilidade e cópias dos dados. Enquanto no modo de espera você precisa configurar seu domínio com as melhores práticas, sem o modo de espera você pode escolher seu próprio número de zonas de disponibilidade, nós e réplicas. Não recomendamos essa opção, a menos que você tenha fluxos de trabalho existentes que seriam interrompidos pela criação de domínios em espera.

Se você escolher essa opção, ainda recomendamos que você selecione três zonas de disponibilidade para permanecer resiliente a falhas de nó, disco e single-AZ. Quando ocorre uma falha, o cluster redistribui os dados pelos recursos restantes para manter a disponibilidade e a redundância. Essa movimentação de dados aumenta o uso de recursos no cluster e pode ter um impacto no desempenho. Se o cluster não for dimensionado adequadamente, ele poderá ter uma disponibilidade reduzida, o que, em grande parte, anula o propósito do multi-AZ.

A única maneira de configurar um domínio sem espera no AWS Management Console é escolher o método de criação padrão e selecionar Domínio sem espera como sua opção de implantação.

Distribuição de fragmentos

Se habilitar Multi-AZ sem standby, você deverá ter pelo menos uma réplica para cada índice no cluster. Sem réplicas, o OpenSearch Serviço não pode distribuir cópias dos seus dados para outras zonas de disponibilidade. Felizmente, a configuração padrão para qualquer índice é uma contagem de réplica de 1. Como mostra o diagrama a seguir, o OpenSearch Service se esforça ao máximo para distribuir os fragmentos primários e seus fragmentos de réplica correspondentes em diferentes zonas.

Além de distribuir fragmentos por zona de disponibilidade, o OpenSearch Service os distribui por nó. Ainda assim, determinadas configurações de domínio podem resultar em contagens de fragmentos desequilibradas. Considere o seguinte domínio:

  • 5 nós de dados

  • 5 fragmentos principais

  • 2 réplicas

  • 3 zonas de disponibilidade

Nessa situação, o OpenSearch serviço precisa sobrecarregar um nó para distribuir os fragmentos primários e de réplica pelas zonas, conforme mostrado no diagrama a seguir.

Para evitar esses tipos de situações, que podem sobrecarregar nós individuais e afetar a performance, recomendamos selecionar multi-AZ com modo de espera ou uma contagem de instâncias que seja um múltiplo de três quando você planejar ter duas ou mais réplicas por índice.

Distribuição de nó principal dedicado

Mesmo que você selecione duas zonas de disponibilidade ao configurar seu domínio, o OpenSearch serviço distribui automaticamente nós mestres dedicados em três zonas de disponibilidade. Essa distribuição ajuda a evitar tempo de inatividade do cluster se uma zona sofrer uma interrupção de serviço. Se você usar os três nós principais dedicados recomendados e uma zona de disponibilidade ficar inativa, seu cluster ainda terá um quorum (2) de nós principais dedicados e poderá selecionar um novo principal. O diagrama a seguir demonstra essa configuração.

Se você escolher um tipo de instância de gerações anteriores que não esteja disponível nas três zonas de disponibilidade, os seguintes cenários se aplicam:

  • Se você escolher três zonas de disponibilidade para o domínio, o OpenSearch serviço gerará um erro. Escolha um tipo de instância diferente e tente novamente.

  • Se você escolher duas zonas de disponibilidade para o domínio, o OpenSearch Serviço distribuirá os nós principais dedicados em duas zonas.

Interrupções na zona de disponibilidade

As interrupções na zona de disponibilidade são raras, mas ocorrem. A tabela a seguir relaciona diferentes configurações de Multi-AZ e comportamentos durante uma interrupção. A última linha na tabela se aplica ao multi-AZ com modo de espera, enquanto todas as outras linhas têm configurações que se aplicam somente ao multi-AZ sem modo de espera.

Número de zonas de disponibilidade em uma região Número de zonas de disponibilidade que você escolheu Número de nós principais dedicados Comportamento se uma zona de disponibilidade apresentar uma interrupção
2 ou mais 2 0

Tempo de inatividade. Seu cluster perde metade dos seus nós de dados e deve substituir pelo menos um na zona de disponibilidade restante antes que possa escolher um principal.

2 2 3

50/50 de chance de inatividade. OpenSearch O serviço distribui dois nós principais dedicados em uma zona de disponibilidade e um na outra:

  • Se a zona de disponibilidade com um nó principal dedicado tiver uma interrupção, os dois nós principais dedicados na zona de disponibilidade restante podem escolher um principal.

  • Se a zona de disponibilidade com dois nós principais dedicados apresentar uma interrupção, o cluster permanecerá indisponível até que a zona de disponibilidade se recupere.

3 ou mais 2 3

Sem tempo de inatividade. OpenSearch O serviço distribui automaticamente os nós principais dedicados em três zonas de disponibilidade, para que os dois nós principais dedicados restantes possam eleger um mestre.

3 ou mais 3 0

Sem tempo de inatividade. Aproximadamente, dois terços dos seus nós de dados ainda estão disponíveis para escolher um principal.

3 ou mais 3 3

Sem tempo de inatividade. Os dois nós principais dedicados restantes podem escolher um principal.

Em todas as configurações, independentemente da causa, as falhas dos nós podem fazer com que os nós de dados restantes do cluster passem por um período de maior carga, enquanto o OpenSearch Serviço configura automaticamente novos nós para substituir os que estão faltando.

Por exemplo, no caso de uma falha na zona de disponibilidade em uma configuração de três zonas, dois terços dos nós de dados terão que processar várias solicitações para o cluster. Conforme eles processam essas solicitações, os nós restantes também estão replicando fragmentos para novos nós à medida que ficam online, o que pode afetar ainda mais a performance. Se a disponibilidade for essencial para sua workload, considere a adição de recursos ao seu cluster para diminuir essa preocupação.

nota

OpenSearch O serviço gerencia domínios Multi-AZ de forma transparente, para que você não possa simular manualmente interrupções na zona de disponibilidade.