Visão geral da política de manutenção de instâncias - Amazon EC2 Auto Scaling

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Visão geral da política de manutenção de instâncias

Este tópico dá uma visão geral das opções disponíveis e descreve o que deve ser considerado ao criar uma política de manutenção de instâncias.

Visão geral

Quando você cria uma política de manutenção de instâncias para seu grupo do Auto Scaling, a política afeta os eventos do Amazon EC2 Auto Scaling que fazem com que as instâncias sejam substituídas. Isso resulta em comportamentos de substituição mais consistentes dentro do mesmo grupo do Auto Scaling. Também permite otimizar seu grupo quanto à disponibilidade ou ao custo, dependendo de suas necessidades.

No console, as seguintes opções de configuração estão disponíveis:

  • Iniciar antes de encerrar – uma nova instância deve ser provisionada primeiro antes que uma instância existente possa ser encerrada. Essa abordagem é uma boa opção para aplicativos que favorecem a disponibilidade em detrimento da redução de custos.

  • Encerrar e executar – novas instâncias são provisionadas ao mesmo tempo em que suas instâncias existentes são encerradas. Essa abordagem é uma boa opção para aplicativos que favorecem a redução de custos em relação à disponibilidade. Também é uma boa opção para aplicativos que não devem lançar mais capacidade do que a disponível atualmente, mesmo ao substituir instâncias.

  • Política personalizada – essa opção permite que você configure sua política com um intervalo mínimo e máximo personalizado para o nível de capacidade que você deseja disponibilizar ao substituir instâncias. Essa abordagem pode ajudá-lo a alcançar o equilíbrio certo entre custo e disponibilidade.

O padrão para um grupo do Auto Scaling é não ter uma política de manutenção de instâncias, o que faz com que ele responda aos eventos de manutenção de instâncias com os comportamentos padrão. Os comportamentos padrão estão descritos na tabela a seguir.

Comportamentos padrão do evento de manutenção de instâncias

Evento

Descrição

Comportamento padrão

Falhas de verificação de integridade

Acontece automaticamente quando as instâncias falham nas verificações de integridade. O Amazon EC2 Auto Scaling substitui instâncias que apresentam falhas de verificação de integridade. Para entender as causas das falhas de verificação de integridade, consulte Verificações de integridade para instâncias em um grupo do Auto Scaling.

Encerrar e iniciar.

Atualização de instância

O que acontece quando você inicia uma atualização de instância. Dependendo de sua configuração, uma atualização de instância substitui instâncias uma de cada vez, várias por vez ou todas de uma vez. Para ter mais informações, consulte Use uma atualização de instância para atualizar instâncias em um grupo de Auto Scaling.

Encerrar e iniciar.

Vida útil máxima da instância

Acontece automaticamente quando as instâncias atingem a vida útil máxima que você especifica para seu grupo do Auto Scaling. O Amazon EC2 Auto Scaling substitui instâncias que atingem sua vida útil máxima. Para ter mais informações, consulte Substituir instâncias do Auto Scaling com base na vida útil máxima da instância.

Encerrar e iniciar.

Rebalanceamento

Acontece automaticamente se houver mudanças subjacentes que façam com que o grupo fique desequilibrado. O Amazon EC2 Auto Scaling reequilibra o grupo nas seguintes situações:

  • Uma zona de disponibilidade que antes tinha capacidade insuficiente se recupera, ou você adiciona ou remove uma zona de disponibilidade do grupo. Quando isso acontece, seu grupo do Auto Scaling tenta se equilibrar uniformemente entre as zonas de disponibilidade. Para ter mais informações, consulte Atividades de rebalanceamento.

  • Você ativa o rebalanceamento de capacidade em seu grupo do Auto Scaling e ele tenta iniciar novas instâncias spot antes que as existentes sejam interrompidas conforme a mudança de disponibilidade das instâncias spot. Para ter mais informações, consulte Usar o rebalanceamento de capacidade para lidar com interrupções de spot do Amazon EC2.

  • Você atualiza seu grupo do Auto Scaling e ele substitui gradualmente as instâncias de acordo com as novas opções de compra que você escolheu ao atualizar uma política de instâncias mistas. Para ter mais informações, consulte Atualizar um grupo do Auto Scaling.

Iniciar antes de encerrar.

O Amazon EC2 Auto Scaling pode exceder os limites de tamanho do seu grupo em até 10% da capacidade máxima. Porém, se você estiver usando o rebalanceamento de capacidade, ele só poderá exceder esses limites em até 10% da capacidade desejada.

O Amazon EC2 Auto Scaling continuará usando como padrão o encerramento e o lançamento nas seguintes situações. Portanto, quando uma dessas situações ocorre, a capacidade do seu grupo pode ser menor que o limite inferior da sua política de manutenção da instância.

  • Quando uma instância é encerrada inesperadamente, por exemplo, devido à ação humana. O Amazon EC2 Auto Scaling substitui imediatamente instâncias que não estão mais em execução. Para ter mais informações, consulte Verificações de integridade do Amazon EC2.

  • Quando o Amazon EC2 reinicia, interrompe ou desativa uma instância como parte de um evento programado antes que o Amazon EC2 Auto Scaling possa iniciar a instância substituta. Para obter mais informações sobre esses eventos, consulte Eventos programados para suas instâncias no Guia do usuário do Amazon EC2.

  • Quando o Amazon EC2 Spot Service inicia uma interrupção de Instância Spot e uma Instância Spot é encerrada à força.

Com as instâncias spot, se você habilitou o rebalanceamento de capacidade em seu grupo do Auto Scaling, talvez a instância já tenha uma instância pendente de um pool spot diferente que lançamos antes de iniciarmos a interrupção spot. Para ver mais detalhes sobre como funciona o rebalanceamento de capacidade, consulte Usar o rebalanceamento de capacidade para lidar com interrupções de spot do Amazon EC2.

Porém, como não é garantido que as Instâncias Spot permaneçam disponíveis e possam ser encerradas com um aviso de interrupção da Instância Spot de dois minutos, o limite inferior da sua política de manutenção de instâncias pode ser excedido se as instâncias forem interrompidas antes do lançamento de suas novas instâncias.

Conceitos principais

Antes de começar, familiarize-se com os seguintes conceitos e termos básicos:

Capacidade desejada

A capacidade desejada é a capacidade do grupo do Auto Scaling no momento da criação. É também a capacidade que o grupo tenta manter quando não há condições de escalabilidade associadas ao grupo.

Políticas de manutenção de instâncias

Uma política de manutenção de instâncias controla se uma instância é provisionada primeiro antes do encerramento de uma instância em eventos de manutenção de instâncias. Também determina até que ponto seu grupo do Auto Scaling pode ir abaixo e acima da capacidade desejada para substituir várias instâncias ao mesmo tempo.

Porcentagem máxima de integridade

A porcentagem máxima de integridade é a porcentagem da capacidade desejada que seu grupo do Auto Scaling pode aumentar ao substituir instâncias. Ela representa a porcentagem máxima do grupo que pode estar em serviço e íntegra, ou pendente, para suportar sua workload. No console, você pode definir a porcentagem máxima de integridade ao usar a opção Iniciar antes de encerrar ou a opção Política personalizada. Os valores válidos são 100 a 200%.

Percentual mínimo de integridade

A porcentagem mínima de integridade é a porcentagem da capacidade desejada para se manter em serviço, íntegra e pronta para ser usada a fim de suportar sua workload ao substituir instâncias. Uma instância é considerada íntegra e pronta para uso depois de concluir com êxito sua primeira verificação de integridade e após o término do tempo de aquecimento especificado. No console, você pode definir a porcentagem mínima de integridade ao usar a opção Encerrar e iniciar ou a opção Política personalizada. Os valores válidos são 0 a 100%.

nota

Para substituir instâncias mais rapidamente, você pode especificar uma porcentagem mínima íntegra baixa. Porém, se não houver instâncias íntegras suficientes em execução, a disponibilidade pode ser reduzida. Recomendamos selecionar um valor razoável para manter a disponibilidade em situações em que várias instâncias serão substituídas.

Aquecimento da instância

Se suas instâncias precisarem de tempo para inicializar depois de entrarem no estadoInService, ative o aquecimento padrão da instância para seu grupo do Auto Scaling. Com o aquecimento padrão da instância, você pode evitar que as instâncias sejam contabilizadas na porcentagem mínima de integridade antes de estarem prontas. Isso garante que o Amazon EC2 Auto Scaling considere quanto tempo é necessário para ter capacidade suficiente para suportar a workload antes de encerrar as instâncias existentes.

Como benefício adicional, você pode melhorar as CloudWatch métricas da Amazon usadas para escalabilidade dinâmica ao ativar o aquecimento padrão da instância. Se seu grupo de Auto Scaling tiver alguma política de escalabilidade, quando o grupo for expandido, ele usará o mesmo período de aquecimento padrão para evitar que as instâncias sejam contabilizadas nas CloudWatch métricas antes de concluírem a inicialização.

Para ter mais informações, consulte Definir o aquecimento padrão da instância para um grupo do Auto Scaling.

Período de carência da verificação de integridade

O Amazon EC2 Auto Scaling determina se a instância está íntegra com base no status das verificações de integridade que o grupo do Auto Scaling usa. Para ter mais informações, consulte Verificações de integridade para instâncias em um grupo do Auto Scaling.

Para garantir que essas verificações de integridade comecem o mais rápido possível, não defina um período de carência da verificação de integridade do grupo muito alto, mas alto o suficiente para que suas verificações de integridade do Elastic Load Balancing consigam determinar se um destino está disponível para lidar com solicitações. Para ter mais informações, consulte Definir um período de carência da verificação de integridade para um grupo do Auto Scaling.

Dimensionar o grupo do Auto Scaling

Uma política de manutenção de instâncias só se aplica a eventos de manutenção de instâncias e não impede que o grupo seja escalado manual ou automaticamente.

Quando há políticas de escalabilidade ou ações programadas anexadas ao seu grupo do Auto Scaling, elas podem ser executadas paralelamente enquanto os eventos de manutenção da instância estão ocorrendo. Nesse caso, eles poderiam aumentar ou diminuir a capacidade desejada do grupo, mas somente dentro dos limites de escalabilidade que você definiu. Para obter mais informações sobre esses limites, consulte Definir limites de escalabilidade para seu grupo do Auto Scaling.

Cenários de exemplo

Em um cenário típico, a política de manutenção da instância e a capacidade desejada podem ser mais ou menos assim:

  • Porcentagem mínima de integridade = 90%

  • Porcentagem máxima de integridade = 120%

  • Capacidade desejada = 100

Durante qualquer evento de manutenção de instância, seu grupo do Auto Scaling pode ter no mínimo 90 instâncias e no máximo 120. Depois do evento, o grupo volta a ter 100 instâncias.

Quando você usa uma política de manutenção de instância com um grupo do Auto Scaling que tem um grupo de aquecimento, as porcentagens de integridade mínima e máxima são aplicadas separadamente ao grupo do Auto Scaling e ao grupo de aquecimento.

Por exemplo, suponha que esta seja sua configuração:

  • Porcentagem mínima de integridade = 90%

  • Porcentagem máxima de integridade = 120%

  • Capacidade desejada = 100

  • Tamanho do grupo de aquecimento = 10

Se você iniciar uma atualização de instância para reciclar as instâncias do grupo, o Amazon EC2 Auto Scaling substituirá primeiro as instâncias no grupo do Auto Scaling e depois as instâncias no grupo de aquecimento. Embora o Amazon EC2 Auto Scaling ainda esteja trabalhando na substituição de instâncias no grupo do Auto Scaling, o grupo pode ter no mínimo 90 instâncias e no máximo 120. Depois de terminar com o grupo, o Amazon EC2 Auto Scaling pode trabalhar na substituição de instâncias no grupo de aquecimento. Enquanto isso acontece, o grupo de aquecimento pode ter no mínimo 9 instâncias e no máximo 12.