Visão geral Conceitos principais Aquecimento da instância Período de carência da verificação de integridade Dimensionar o grupo do Auto Scaling Cenários de exemplo

Política de manutenção de instância para o grupo do Auto Scaling

Este tópico dá uma visão geral das opções disponíveis e descreve o que deve ser considerado ao criar uma política de manutenção de instâncias.

Conteúdo

Visão geral
Conceitos principais
Aquecimento da instância
Período de carência da verificação de integridade
Dimensionar o grupo do Auto Scaling
Cenários de exemplo

Visão geral

Quando você cria uma política de manutenção de instâncias para seu grupo de Auto Scaling, a política afeta os eventos do Amazon Auto EC2 Scaling que fazem com que as instâncias sejam substituídas. Isso resulta em comportamentos de substituição mais consistentes dentro do mesmo grupo do Auto Scaling. Também permite otimizar seu grupo quanto à disponibilidade ou ao custo, dependendo de suas necessidades.

No console, as seguintes opções de configuração estão disponíveis:

Iniciar antes de encerrar: uma nova instância deve ser provisionada primeiro antes que uma instância existente possa ser encerrada. Essa abordagem é uma boa opção para aplicações que favorecem a disponibilidade em detrimento da redução de custos.
Encerrar e iniciar: novas instâncias são provisionadas ao mesmo tempo em que suas instâncias existentes são encerradas. Essa abordagem é uma boa opção para aplicações que favorecem a redução de custos em relação à disponibilidade. Também é uma boa opção para aplicações que não devem lançar mais capacidade do que a disponível atualmente, mesmo ao substituir instâncias.
Política personalizada – essa opção permite que você configure sua política com um intervalo mínimo e máximo personalizado para o nível de capacidade que você deseja disponibilizar ao substituir instâncias. Essa abordagem pode ajudar a alcançar o equilíbrio certo entre custo e disponibilidade.

O padrão para um grupo do Auto Scaling é não ter uma política de manutenção de instâncias, o que faz com que ele responda aos eventos de manutenção de instâncias com os comportamentos padrão. Os comportamentos padrão estão descritos na tabela a seguir.

Comportamentos padrão do evento de manutenção de instâncias
Event	Descrição	Comportamento padrão
Falhas de verificação de integridade	Acontece automaticamente quando as instâncias falham nas verificações de integridade. O Amazon EC2 Auto Scaling substitui instâncias que falham em suas verificações de saúde. Para entender as causas das falhas de verificação de integridade, consulte Verificações de integridade para instâncias em um grupo do Auto Scaling.	Encerrar e iniciar.
Atualização de instância	O que acontece quando você inicia uma atualização de instância. Dependendo de sua configuração, uma atualização de instância substitui instâncias uma de cada vez, várias por vez ou todas de uma vez. Para obter mais informações, consulte Use uma atualização de instância para atualizar instâncias em um grupo do Auto Scaling.	Encerrar e iniciar.
Vida útil máxima da instância	Acontece automaticamente quando as instâncias atingem a vida útil máxima que você especifica para seu grupo do Auto Scaling. O Amazon EC2 Auto Scaling substitui as instâncias que atingem sua vida útil máxima. Para obter mais informações, consulte Substituir instâncias do Auto Scaling com base na vida útil máxima da instância.	Encerrar e iniciar.
Rebalanceamento	Acontece automaticamente se houver mudanças subjacentes que façam com que o grupo fique desequilibrado. O Amazon EC2 Auto Scaling reequilibra o grupo nas seguintes situações: Uma zona de disponibilidade que antes tinha capacidade insuficiente se recupera, ou você adiciona ou remove uma zona de disponibilidade do grupo. Quando isso acontece, seu grupo do Auto Scaling tenta se equilibrar uniformemente entre as zonas de disponibilidade. Para obter mais informações, consulte Atividades de rebalanceamento. Você ativa o rebalanceamento de capacidade em seu grupo do Auto Scaling e ele tenta iniciar novas instâncias spot antes que as existentes sejam interrompidas conforme a mudança de disponibilidade das instâncias spot. Para obter mais informações, consulte Rebalanceamento de capacidade no Auto Scaling para substituir instâncias spot em risco. Você atualiza seu grupo do Auto Scaling e ele substitui gradualmente as instâncias de acordo com as novas opções de compra que você escolheu ao atualizar uma política de instâncias mistas. Para obter mais informações, consulte Update an Auto Scaling group.	Iniciar antes de encerrar. O Amazon EC2 Auto Scaling pode exceder os limites de tamanho do seu grupo em até 10% de sua capacidade máxima. Porém, se você estiver usando o rebalanceamento de capacidade, ele só poderá exceder esses limites em até 10% da capacidade desejada.

O Amazon EC2 Auto Scaling continuará adotando como padrão o encerramento e o lançamento nas seguintes situações. Portanto, quando uma dessas situações ocorre, a capacidade do seu grupo pode ser menor que o limite inferior da sua política de manutenção da instância.

Quando uma instância é encerrada inesperadamente, por exemplo, devido à ação humana. O Amazon EC2 Auto Scaling substitui imediatamente as instâncias que não estão mais em execução. Para obter mais informações, consulte Exames EC2 de saúde da Amazon.
Quando a Amazon EC2 reinicia, interrompe ou desativa uma instância como parte de um evento programado antes que o Amazon Auto EC2 Scaling possa iniciar a instância substituta. Para obter mais informações sobre esses eventos, consulte Eventos programados para suas instâncias no Guia EC2 do usuário da Amazon.
Quando o Amazon EC2 Spot Service inicia uma interrupção de Instância Spot e uma Instância Spot é encerrada à força.

Com as instâncias spot, se você habilitou o rebalanceamento de capacidade em seu grupo do Auto Scaling, talvez a instância já tenha uma instância pendente de um pool spot diferente que lançamos antes de iniciarmos a interrupção spot. Para ver mais detalhes sobre como funciona o rebalanceamento de capacidade, consulte Rebalanceamento de capacidade no Auto Scaling para substituir instâncias spot em risco.

Porém, como não é garantido que as Instâncias spot permaneçam disponíveis e possam ser encerradas com um aviso de interrupção da Instância spot de dois minutos, o limite inferior da sua política de manutenção de instâncias pode ser excedido se as instâncias forem interrompidas antes do lançamento de suas novas instâncias.

Conceitos principais

Antes de começar, familiarize-se com os seguintes conceitos e termos básicos:

Capacidade desejada: A capacidade desejada é a capacidade do grupo do Auto Scaling no momento da criação. É também a capacidade que o grupo tenta manter quando não há condições de escalabilidade associadas ao grupo.
Políticas de manutenção de instâncias: Uma política de manutenção de instâncias controla se uma instância é provisionada primeiro antes do encerramento de uma instância em eventos de manutenção de instâncias. Também determina até que ponto seu grupo do Auto Scaling pode ir abaixo e acima da capacidade desejada para substituir várias instâncias ao mesmo tempo.
Porcentagem máxima de integridade: A porcentagem máxima de integridade é a porcentagem da capacidade desejada que seu grupo do Auto Scaling pode aumentar ao substituir instâncias. Ela representa a porcentagem máxima do grupo que pode estar em serviço e íntegra, ou pendente, para suportar sua workload. No console, você pode definir a porcentagem máxima de integridade ao usar a opção Iniciar antes de encerrar ou a opção Política personalizada. Os valores válidos são 100 a 200%.
Percentual mínimo de integridade: A porcentagem mínima de integridade é a porcentagem da capacidade desejada para se manter em serviço, íntegra e pronta para ser usada a fim de suportar sua workload ao substituir instâncias. Uma instância é considerada íntegra e pronta para uso depois de concluir com êxito sua primeira verificação de integridade e após o término do tempo de aquecimento especificado. No console, você pode definir a porcentagem mínima de integridade ao usar a opção Encerrar e iniciar ou a opção Política personalizada. Os valores válidos são 0 a 100%.

nota
Para substituir instâncias mais rapidamente, você pode especificar uma porcentagem mínima íntegra baixa. Porém, se não houver instâncias íntegras suficientes em execução, a disponibilidade pode ser reduzida. Recomendamos selecionar um valor razoável para manter a disponibilidade em situações em que várias instâncias serão substituídas.

Aquecimento da instância

Se suas instâncias precisarem de tempo para inicializar depois de entrarem no estadoInService, ative o aquecimento padrão da instância para seu grupo do Auto Scaling. Com o aquecimento padrão da instância, você pode evitar que as instâncias sejam contabilizadas na porcentagem mínima de integridade antes de estarem prontas. Isso garante que o Amazon EC2 Auto Scaling considere quanto tempo é necessário para ter capacidade suficiente para suportar a carga de trabalho antes de encerrar as instâncias existentes.

Como benefício adicional, você pode melhorar as CloudWatch métricas da Amazon usadas para escalabilidade dinâmica ao ativar o aquecimento padrão da instância. Se seu grupo de Auto Scaling tiver alguma política de escalabilidade, quando o grupo for expandido, ele usará o mesmo período de aquecimento padrão para evitar que as instâncias sejam contabilizadas nas CloudWatch métricas antes de concluírem a inicialização.

Para obter mais informações, consulte Definir o aquecimento padrão da instância para um grupo do Auto Scaling.

Período de carência da verificação de integridade

O Amazon EC2 Auto Scaling determina se uma instância está íntegra com base no status das verificações de saúde que seu grupo de Auto Scaling usa. Para obter mais informações, consulte Verificações de integridade para instâncias em um grupo do Auto Scaling.

Para garantir que essas verificações de integridade comecem o mais rápido possível, não defina um período de carência da verificação de integridade do grupo muito alto, mas alto o suficiente para que suas verificações de integridade do Elastic Load Balancing consigam determinar se um destino está disponível para lidar com solicitações. Para obter mais informações, consulte Definir um período de carência da verificação de integridade para um grupo do Auto Scaling.

Dimensionar o grupo do Auto Scaling

Uma política de manutenção de instâncias só se aplica a eventos de manutenção de instâncias e não impede que o grupo seja escalado manual ou automaticamente.

Quando há políticas de escalabilidade ou ações programadas anexadas ao seu grupo do Auto Scaling, elas podem ser executadas paralelamente enquanto os eventos de manutenção da instância estão ocorrendo. Nesse caso, eles poderiam aumentar ou diminuir a capacidade desejada do grupo, mas somente dentro dos limites de escalabilidade que você definiu. Para obter mais informações sobre esses limites, consulte Definir limites de escalabilidade para seu grupo do Auto Scaling.

Cenários de exemplo

Em um cenário típico, a política de manutenção da instância e a capacidade desejada podem ser mais ou menos assim:

Porcentagem mínima de integridade = 90%
Porcentagem máxima de integridade = 120%
Capacidade desejada = 100

Durante qualquer evento de manutenção de instância, seu grupo do Auto Scaling pode ter no mínimo 90 instâncias e no máximo 120. Depois do evento, o grupo volta a ter 100 instâncias.

Quando você usa uma política de manutenção de instância com um grupo do Auto Scaling que tem um pool ativo, as porcentagens de integridade mínima e máxima são aplicadas separadamente ao grupo do Auto Scaling e ao pool ativo.

Por exemplo, suponha que esta seja sua configuração:

Porcentagem mínima de integridade = 90%
Porcentagem máxima de integridade = 120%
Capacidade desejada = 100
Tamanho do pool ativo = 10

Se você iniciar uma atualização de instância para reciclar as instâncias do grupo, o Amazon Auto EC2 Scaling substituirá primeiro as instâncias no grupo Auto Scaling e depois as instâncias no pool aquecido. Embora o Amazon EC2 Auto Scaling ainda esteja trabalhando na substituição de instâncias no grupo Auto Scaling, o grupo pode ter apenas 90 instâncias e até 120. Depois de terminar com o grupo, o Amazon EC2 Auto Scaling pode trabalhar na substituição de instâncias no pool aquecido. Enquanto isso acontece, o pool ativo pode ter no mínimo 9 instâncias e no máximo 12.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Políticas de manutenção de instância

Defina uma política de manutenção de instância no seu grupo