Políticas de Auto Scaling - Amazon ElastiCache (Redis OSS)

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Políticas de Auto Scaling

Uma política de escalabilidade tem os seguintes componentes:

  • Uma métrica alvo — A CloudWatch métrica que o Auto Scaling ElastiCache (Redis OSS) usa para determinar quando e quanto escalar.

  • Capacidade mínima e máxima: o número mínimo e máximo de fragmentos a ser usado para a escalabilidade.

    Importante

    Ao criar a política de Auto Scaling, se a capacidade atual for maior do que a capacidade máxima configurada, escalamos para a MaxCapacity durante a criação da política. Da mesma forma, se a capacidade atual for menor que a capacidade mínima configurada, escalamos para o. MinCapacity

  • Um período de desaquecimento: a quantidade de tempo, em segundos, que outra ação de aumento ou redução de escala na horizontal deve aguardar antes de ser iniciada, após a conclusão de uma ação de expansão ou redução.

  • Uma função vinculada ao serviço — uma função do AWS Identity and Access Management (IAM) vinculada a um serviço específico. AWS Uma função vinculada ao serviço inclui todas as permissões que o serviço exige para chamar outros AWS serviços em seu nome. ElastiCache (Redis OSS) O Auto Scaling gera automaticamente essa função AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG para você.

  • Habilitar ou desabilitar atividades de redução de escala na horizontal: capacidade de habilitar ou desabilitar atividades de redução de escala na horizontal para uma política.

Métrica de destino para o Auto Scaling

Nesse tipo de política, uma métrica predefinida ou personalizada e um valor alvo para a métrica são especificados em uma configuração de política de escalabilidade de rastreamento de metas. ElastiCache (Redis OSS) O Auto Scaling cria e CloudWatch gerencia alarmes que acionam a política de escalabilidade e calcula o ajuste de escalabilidade com base na métrica e no valor alvo. A política de escalabilidade adiciona ou remove fragmentos/réplicas conforme necessário para manter a métrica no valor de destino especificado ou próxima a ele. Além de manter a métrica próxima ao valor de destino, uma política de escalabilidade de rastreamento de destino também se ajusta às flutuações na métrica, devido a workloads variáveis. Essas políticas também minimizam flutuações rápidas no número de fragmentos/réplicas disponíveis para seu cluster.

Por exemplo, considere uma política de escalabilidade que use a métrica predefinida de média ElastiCachePrimaryEngineCPUUtilization. Essa política pode manter a utilização da CPU a um percentual de utilização específico, por exemplo, 70 por cento, ou próximo a isso.

nota

Para cada cluster, você pode criar somente uma política de Auto Scaling para cada métrica de destino.

Capacidades mínima e máxima

Estilhaços

Você pode especificar o número máximo de fragmentos que podem ser escalados pelo escalonamento automático ElastiCache (Redis OSS). Esse valor deve ser menor que ou igual a 250, com um mínimo de 1. Você também pode especificar o número mínimo de fragmentos a serem gerenciados pelo escalonamento automático ElastiCache (Redis OSS). O valor mínimo é 1, e deve ser menor ou igual ao valor especificado para o número máximo de fragmentos de 250.

Réplicas

Você pode especificar o número máximo de réplicas a serem gerenciadas pelo escalonamento automático ElastiCache (Redis OSS). Esse valor deve ser igual ou menor que 5. Você também pode especificar o número mínimo de réplicas a serem gerenciadas pelo escalonamento automático ElastiCache (Redis OSS). O valor mínimo é 1, e deve ser menor ou igual ao valor especificado para o número máximo de réplicas de 5.

Para determinar o número mínimo e máximo de fragmentos/réplicas que você precisa para um tráfego típico, teste a configuração do Auto Scaling com a taxa esperada de tráfego para o modelo.

nota

ElastiCache As políticas de escalonamento automático (Redis OSS) aumentam a capacidade do cluster até que ele atinja o tamanho máximo definido ou até que os limites de serviço sejam aplicados. Para solicitar um aumento de limite, consulte Limites de serviço da AWS e selecione o tipo de limite Nodes per cluster per instance type (Nós por cluster por tipo de instância).

Importante

Redução de escala na horizontal quando não há tráfego Se o tráfego de uma variante se tornar zero, o ElastiCache (Redis OSS) se expande automaticamente para o número mínimo de instâncias especificado.

Período de desaquecimento

Você pode ajustar a responsividade das políticas de escalabilidade com monitoramento do objetivo, adicionando períodos de desaquecimento que afetam a escalabilidade de seu cluster. Um desaquecimento bloqueia solicitações subsequentes de redução ou expansão até o período expirar. Isso retarda a exclusão de fragmentos/réplicas em seu cluster ElastiCache (Redis OSS) para solicitações de expansão e a criação de fragmentos/réplicas para solicitações de expansão. Você pode especificar os seguintes desaquecimentos:

  • Uma atividade de escalabilidade reduz o número de fragmentos/réplicas em seu ElastiCache cluster (Redis OSS). Um desaquecimento de redução especifica a quantidade de tempo, em segundos, após a conclusão de uma ação de redução antes que quaisquer outras atividades de redução possam iniciar.

  • Uma atividade de expansão aumenta o número de fragmentos/réplicas em seu ElastiCache cluster (Redis OSS). Um desaquecimento de expansão especifica a quantidade de tempo, em segundos, após a conclusão de uma ação de expansão antes que quaisquer outras atividades de expansão possam iniciar.

Quando o período de desaquecimento de redução ou aumento de escala na horizontal não é especificado, o padrão para o aumento é de 600 segundos, e para a redução, 900 segundos.

Habilitar ou desabilitar atividades de redução

Você pode habilitar ou desabilitar atividades de redução para as políticas. Habilitar atividades de redução de escala na horizontal permite que as políticas de escalabilidade excluam fragmentos/réplicas. Quando as atividades de redução são habilitadas, o desaquecimento de redução na política de escalabilidade aplica-se a atividades de redução. Desabilitar atividades de redução de escala na horizontal evita que as políticas de escalabilidade excluam fragmentos/réplicas.

nota

As atividades de escalabilidade horizontal estão sempre habilitadas para que a política de escalabilidade possa criar fragmentos/réplicas ElastiCache (Redis OSS) conforme necessário.