Práticas recomendadas para planos de escalabilidade do - AWS Auto Scaling

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Práticas recomendadas para planos de escalabilidade do

As práticas recomendadas a seguir podem ajudá-lo a obter o máximo dos planos de escalabilidade:

  • Ao criar um modelo de execução ou uma configuração de execução, habilite o monitoramento detalhado para obter dados de métricas do CloudWatch para instâncias do EC2 em uma frequência de um minuto, pois isso garante uma resposta mais rápida às alterações de carga. Aumentar a escalabilidade das métricas com intervalos de cinco minutos pode resultar em tempo de resposta mais lento e aumentar a escalabilidade de dados obsoletos. Por padrão, as instâncias do EC2 são habilitadas para monitoramento básico, ou seja, os dados de métrica para instâncias estão disponíveis em intervalos de cinco minutos. Para uma cobrança adicional, habilite o monitoramento detalhado para obter dados de métrica para instâncias em intervalos de um minuto. Para obter mais informações, consulte Configurar o monitoramento de instâncias do Auto Scaling no Guia do usuário do Amazon EC2 Auto Scaling.

  • Também recomendamos que você habilite as métricas do grupo do Auto Scaling. Caso contrário, a capacidade real dos dados não é mostrada nos gráficos de previsão de capacidade que são disponibilizados na conclusão assistente de criação do plano de dimensionamento. Para obter mais informações, consulte Monitorar métricas do CloudWatch para grupos de Auto Scaling e instâncias no Guia do usuário do Amazon EC2 Auto Scaling.

  • Verifique qual tipo de instância o grupo do Auto Scaling usa e atente-se para o uso de um tipo de instância expansível. As instâncias expansíveis do Amazon EC2, como instâncias T3 e T2, foram criadas para oferecer um nível básico de performance de CPU com capacidade de expansão para um nível superior quando exigido pela workload. Dependendo da utilização de destino especificado pelo plano de escalabilidade, você pode executar o risco de exceder a linha de base e, em seguida, executar fora de créditos de CPU, que limita a performance. Para obter mais informações, consulte Créditos de CPU e performance básica para instâncias expansíveis. Para configurar as instâncias como unlimited, consulte Usar um grupo do Auto Scaling para executar uma instância expansível como ilimitada no Manual do usuário do Amazon EC2 para instâncias do Linux.

Outras considerações

nota

Há uma versão mais recente do escalonamento preditivo, lançada em maio de 2021. Alguns recursos apresentados nessa versão não estão disponíveis nos planos de escalabilidade e você deverá usar uma política de escalabilidade preditiva definida diretamente no grupo do Auto Scaling para acessar esses recursos. Para obter mais informações, consulte Escalabilidade predtiva o Amazon EC2 Auto Scaling no Manual do usuário do Amazon EC2 Auto Scaling.

Tenha as seguintes considerações adicionais em mente:

  • A escalabilidade preditiva usa previsões de carga para programar a capacidade no futuro. A qualidade das previsões varia com base na quantidade de ciclos da carga e na aplicabilidade do modelo de previsão treinado. O dimensionamento preditivo pode ser executado no modo somente previsão para avaliar a qualidade das previsões e das ações de dimensionamento criadas pela previsão. Você poderá definir o modo de dimensionamento preditivo para Forecast only (Somente previsão) ao criar o plano de dimensionamento e alterá-lo para Forecast and scale (Previsão e dimensionamento) quando a avaliação da qualidade da previsão for concluída. Para obter mais informações, consulte Configurações de dimensionamento preditivo e Monitorar e avaliar previsões.

  • Se você optar por especificar diferentes métricas para escalabilidade preditiva, é necessário garantir que a métrica de escalabilidade e a métrica de carga sejam altamente correlacionadas. O valor da métrica deve aumentar e diminuir em proporção ao número das instâncias no grupo do Auto Scaling. Isso garante que os dados da métrica possam ser usados para expandir ou reduzir proporcionalmente o número de instâncias. Por exemplo, a métrica de carga é a contagem total da solicitação e a métrica de escalabilidade é a utilização média da CPU. Se a contagem total da solicitação aumenta em 50%, a média de utilização da CPU também deve aumentar em 50%, desde que a capacidade permaneça inalterada.

  • Antes de criar o plano de dimensionamento, você deve excluir as ações de dimensionamento programadas anteriormente que não são mais necessárias acessando os consoles a partir dos quais elas foram criadas. O AWS Auto Scaling não cria uma ação de dimensionamento preditiva que substitui uma ação de dimensionamento programada existente.

  • Suas configurações personalizadas para capacidade mínima e máxima, juntamente com outras configurações usadas para escalabilidade dinâmica, mostrados em outros consoles. No entanto, recomendamos que, após criar um plano de dimensionamento, você não modifique essas configurações a partir de outros consoles, pois o plano de dimensionamento não recebe as atualizações de outros consoles.

  • Seu plano de dimensionamento pode conter recursos de vários serviços, mas cada recurso pode estar somente em um plano de dimensionamento por vez.

Evitar o erro ActiveWithProblems

Um erro “ActiveWithProblems” pode ocorrer quando um plano de escalabilidade é criado, ou quando recursos são adicionados a um plano de escalabilidade. O erro ocorre quando o plano de escalabilidade está ativo, mas não foi possível aplicar a configuração de escalabilidade a um ou mais recursos.

Geralmente, ele ocorre porque um recurso já tem uma política de escalabilidade ou um grupo do Auto Scaling não cumpre os requisitos mínimos para a escalabilidade preditiva.

Se algum dos recursos já tiver políticas de escalabilidade de vários consoles de serviços, o AWS Auto Scaling não substituirá as outras políticas de escalabilidade nem criará recursos por padrão. Você também pode excluir as políticas de escalabilidade existentes e substituí-las pelas políticas de escalabilidade de rastreamento de destino criadas no console do AWS Auto Scaling. Faça isso habilitando a configuração Replace external scaling policies (Substituir políticas externas de escalabilidade) de todos os recursos que tiverem políticas de escalabilidade a serem substituídas.

Com a escalabilidade preditiva, recomendamos aguardar 24 horas após a criação de um grupo do Auto Scaling para configurar a escalabilidade. Deve haver, no mínimo, 24 horas de dados históricos para gerar a previsão inicial. Se o grupo tiver menos de 24 horas de dados históricos e a escalabilidade preditiva estiver habilitada, o plano de escalabilidade não poderá gerar uma previsão até o próximo período de previsão após o grupo coletar a quantidade necessária de dados. No entanto, você também pode editar e salvar o plano de escalabilidade para reiniciar o processo de previsão assim que as 24 horas de dados estiverem disponíveis.