Métrica de destino para o Auto Scaling Capacidades mínima e máxima Período de desaquecimento Habilitar ou desabilitar atividades de redução

Políticas de Auto Scaling

Uma política de escalabilidade tem os seguintes componentes:

Uma métrica alvo — A CloudWatch métrica que ElastiCache o Valkey e o Redis OSS Auto Scaling usa para determinar quando e quanto escalar.
Capacidade mínima e máxima: o número mínimo e máximo de fragmentos a ser usado para a escalabilidade.

Importante
Ao criar a política de Auto Scaling, se a capacidade atual for maior que a capacidade máxima configurada, escalamos para a MaxCapacity durante a criação da política. Da mesma forma, se a capacidade atual for menor que a capacidade mínima configurada, escalamos para o. MinCapacity
Um período de desaquecimento: a quantidade de tempo, em segundos, que outra ação de aumento ou redução de escala na horizontal deve aguardar antes de ser iniciada, após a conclusão de uma ação de expansão ou redução.
Uma função vinculada ao serviço — uma função do AWS Identity and Access Management (IAM) vinculada a um serviço específico. AWS Uma função vinculada ao serviço inclui todas as permissões que o serviço exige para chamar outros AWS serviços em seu nome. ElastiCache O Auto Scaling gera automaticamente essa função para AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG você.
Habilitar ou desabilitar atividades de redução de escala na horizontal: capacidade de habilitar ou desabilitar atividades de redução de escala na horizontal para uma política.

Tópicos

Métrica de destino para o Auto Scaling
Capacidades mínima e máxima
Período de desaquecimento
Habilitar ou desabilitar atividades de redução

Métrica de destino para o Auto Scaling

Nesse tipo de política, uma métrica predefinida ou personalizada e um valor alvo para a métrica são especificados em uma configuração de política de escalabilidade de rastreamento de metas. ElastiCache para Valkey e Redis, o OSS Auto Scaling cria e gerencia CloudWatch alarmes que acionam a política de escalabilidade e calcula o ajuste de escalabilidade com base na métrica e no valor alvo. A política de escalabilidade adiciona ou remove shards/replicas conforme necessário para manter a métrica no valor alvo especificado ou próximo a ele. Além de manter a métrica próxima ao valor de destino, uma política de escalabilidade de rastreamento de destino também se ajusta às flutuações na métrica, devido a workloads variáveis. Essa política também minimiza as flutuações rápidas no número de unidades disponíveis shards/replicas para seu cluster.

Por exemplo, considere uma política de escalabilidade que use a métrica predefinida de média ElastiCachePrimaryEngineCPUUtilization. Essa política pode manter a utilização da CPU a um percentual de utilização específico, por exemplo, 70 por cento, ou próximo a isso.

nota

Para cada cluster, você pode criar somente uma política de Auto Scaling para cada métrica de destino.

Capacidades mínima e máxima

Estilhaços

Você pode especificar o número máximo de fragmentos que podem ser escalados para o escalonamento automático do Valkey e do Redis OSS. ElastiCache Esse valor deve ser menor que ou igual a 250, com um mínimo de 1. Você também pode especificar o número mínimo de fragmentos a serem gerenciados pelo ajuste de escala automático. O valor mínimo é 1, e deve ser menor ou igual ao valor especificado para o número máximo de fragmentos de 250.

Réplicas

Você pode especificar o número máximo de réplicas a serem gerenciadas ElastiCache para o escalonamento automático do Valkey e do Redis OSS. Esse valor deve ser igual ou menor que 5. Você também pode especificar o número mínimo de réplicas a serem gerenciadas pelo ajuste de escala automático. O valor mínimo é 1, e deve ser menor ou igual ao valor especificado para o número máximo de réplicas de 5.

Para determinar o número mínimo e máximo shards/replicas que você precisa para o tráfego típico, teste sua configuração do Auto Scaling com a taxa de tráfego esperada para seu modelo.

nota

ElastiCache as políticas de auto scaling aumentam a capacidade do cluster até que ele atinja o tamanho máximo definido ou até que os limites de serviço sejam aplicados. Para solicitar um aumento de limite, consulte Limites de serviço da AWS e selecione o tipo de limite Nodes per cluster per instance type (Nós por cluster por tipo de instância).

Importante

Redução de escala na horizontal quando não há tráfego Se o tráfego de uma variante se tornar zero, ElastiCache será automaticamente escalado para o número mínimo de instâncias especificado.

Período de desaquecimento

Você pode ajustar a responsividade das políticas de escalabilidade com monitoramento do objetivo, adicionando períodos de desaquecimento que afetam a escalabilidade de seu cluster. Um desaquecimento bloqueia solicitações subsequentes de redução ou expansão até o período expirar. Isso retarda as exclusões do shards/replicas seu cluster OSS ElastiCache para Valkey e Redis para solicitações de expansão e a criação de para solicitações de expansão. shards/replicas Você pode especificar os seguintes desaquecimentos:

Uma atividade de escalabilidade reduz o número de shards/replicas em seu cluster. Um desaquecimento de redução especifica a quantidade de tempo, em segundos, após a conclusão de uma ação de redução antes que quaisquer outras atividades de redução possam iniciar.
Uma atividade de escalabilidade horizontal aumenta o número de shards/replicas em seu cluster. Um desaquecimento de expansão especifica a quantidade de tempo, em segundos, após a conclusão de uma ação de expansão antes que quaisquer outras atividades de expansão possam iniciar.

Quando o período de desaquecimento de redução ou aumento de escala na horizontal não é especificado, o padrão para o aumento é de 600 segundos, e para a redução, 900 segundos.

Habilitar ou desabilitar atividades de redução

Você pode habilitar ou desabilitar atividades de redução para as políticas. A ativação de atividades de expansão permite que a política de escalabilidade seja excluída. shards/replicas. When scale-in activities are enabled, the scale-in cooldown period in the scaling policy applies to scale-in activities. Disabling scale-in activities prevents the scaling policy from deleting shards/replicas

nota

As atividades de escalabilidade horizontal estão sempre habilitadas para que a política de escalabilidade possa criar ElastiCache fragmentos ou réplicas conforme necessário.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Auto Scaling de clusters Valkey e Redis OSS

Uso do Auto Scaling com fragmentos