Métrica de destino para Auto Scaling Capacidad mínima y máxima Periodo de recuperación Activar o desactivar actividades de escalado descendente

Políticas de Auto Scaling

Una directiva de escalado tiene los siguientes componentes:

Una métrica objetivo: la CloudWatch métrica que Auto Scaling ElastiCache (Redis OSS) usa para determinar cuándo y cuánto escalar.
Capacidad mínima y máxima: el número mínimo y máximo de particiones o réplicas que se utilizarán para el escalado.

importante
Al crear la política de escalado automático, si la capacidad actual es superior a la capacidad máxima configurada, la aplicamos MaxCapacity durante la creación de la política. Del mismo modo, si la capacidad actual es inferior a la capacidad mínima configurada, escalamos hacia fuera hasta la. MinCapacity
Un periodo de recuperación: la cantidad de tiempo, en segundos, tras completarse una actividad de reducción o escalado horizontal antes de que pueda comenzar otra actividad de escalado horizontal.
Un rol vinculado a un servicio: un rol de AWS Identity and Access Management (IAM) que está vinculado a un servicio específico. AWS Un rol vinculado a un servicio incluye todos los permisos que el servicio requiere para llamar a otros AWS servicios en tu nombre. ElastiCache (Redis OSS) Auto Scaling genera automáticamente este rol para usted. AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG
Habilitar o deshabilitar actividades de reducción horizontal: permite habilitar o deshabilitar actividades de reducción horizontal para una política.

Temas

Métrica de destino para Auto Scaling
Capacidad mínima y máxima
Periodo de recuperación
Activar o desactivar actividades de escalado descendente

Métrica de destino para Auto Scaling

En este tipo de política, se especifican una métrica predefinida o personalizada y un valor objetivo para la métrica en una configuración de política de escalado de seguimiento de objetivos. ElastiCache (Redis OSS) Auto Scaling crea y administra CloudWatch las alarmas que activan la política de escalado y calcula el ajuste de escalado en función de la métrica y el valor objetivo. La política de escalado agrega o elimina las particiones/réplicas en función de las necesidades para mantener la métrica en el valor objetivo especificado o en un valor próximo. Además de mantener la métrica próxima al valor de destino, la política de escalado de seguimiento de destino también se ajusta a las fluctuaciones de la métrica producidas por una carga de trabajo en constante cambio. Esta política también minimiza las fluctuaciones rápidas del número de particiones/réplicas disponibles de su clúster.

Por ejemplo, considere una política de escalado que utilice la métrica ElastiCachePrimaryEngineCPUUtilization media predefinida. Esta política puede mantener la utilización de la CPU en el porcentaje de utilización especificado o en un valor próximo, como el 70 %.

nota

Para cada clúster, puede crear solo una política de Auto Scaling para cada métrica de destino.

Capacidad mínima y máxima

Particiones

Puede especificar la cantidad máxima de fragmentos a los que se puede escalar mediante el escalado automático ElastiCache (Redis OSS). Este valor debe ser igual o inferior a 250 con un mínimo de 1. También puede especificar la cantidad mínima de fragmentos que se administrarán mediante el escalado automático ElastiCache (Redis OSS). Este valor debe ser al menos 1, e igual o inferior al valor especificado para el máximo de 250 particiones.

Réplicas

Puede especificar el número máximo de réplicas que se administrarán mediante el autoescalado ElastiCache (Redis OSS). Este valor debe ser igual o inferior a 5. También puede especificar el número mínimo de réplicas que se administrarán mediante el autoescalado ElastiCache (Redis OSS). Este valor debe ser al menos 1, e igual o inferior al valor especificado para el máximo de 5 réplicas.

A fin de determinar el número mínimo y máximo de particiones/réplicas que necesite para el tráfico normal, pruebe la configuración de Auto Scaling con la tasa de tráfico esperada para su modelo.

nota

ElastiCache Las políticas de escalado automático (Redis OSS) aumentan la capacidad del clúster hasta que alcance el tamaño máximo definido o hasta que se apliquen los límites de servicio. Para solicitar un aumento del límite, consulte AWS Service Limits y elija el tipo de límite Nodes per cluster per instance type (Nodos por clúster por tipo de instancias).

importante

La reducción horizontal sucede cuando no hay tráfico. Si el tráfico de una variante se reduce a cero, ElastiCache (Redis OSS) se amplía automáticamente hasta el número mínimo de instancias especificado.

Periodo de recuperación

Puede ajustar la capacidad de respuesta de una política de escalado de seguimiento de destino al agregar periodos de recuperación que afecten al escalado de su clúster. Un periodo de recuperación bloquea solicitudes de escalado descendente o ascendente posteriores hasta que vence el periodo. Esto ralentiza la eliminación de fragmentos o réplicas en su clúster ElastiCache (Redis OSS) para las solicitudes de escalado interno y la creación de fragmentos/réplicas para las solicitudes de escalamiento horizontal. Puede especificar los siguientes periodos de recuperación:

Una actividad de escalamiento horizontal reduce la cantidad de fragmentos o réplicas en su clúster (de Redis OSS). ElastiCache Un periodo de recuperación de escalado descendente especifica la cantidad de tiempo, en segundos, tras completarse una actividad de escalado descendente antes de que pueda comenzar otra actividad de escalado descendente.
Una actividad de escalamiento horizontal aumenta la cantidad de fragmentos o réplicas en su clúster (de Redis OSS). ElastiCache Un periodo de recuperación de escalado ascendente especifica la cantidad de tiempo, en segundos, tras completarse una actividad de escalado ascendente antes de que pueda comenzar otra actividad de escalado ascendente.

Si no se especifica un periodo de recuperación de reducción o escalado horizontal, el valor predeterminado del escalado horizontal es de 600 segundos y de la reducción horizontal es de 900 segundos.

Activar o desactivar actividades de escalado descendente

Puede habilitar o deshabilitar actividades de escalado descendente para una política. La habilitación de actividades de reducción horizontal permite a la política de escalado eliminar particiones/réplicas. Al habilitarse actividades de escalado descendente, el periodo de recuperación de escalado descendente de la política de escalado se aplica a las actividades de escalado descendente. La deshabilitación de actividades de reducción horizontal impide a la política de escalado eliminar particiones/réplicas.

nota

Las actividades de escalado horizontal siempre están habilitadas para que la política de escalado pueda crear fragmentos/réplicas (Redis OSS) según sea necesario. ElastiCache

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Clústeres de Auto Scaling ElastiCache (Redis OSS)

Uso de Auto Scaling con particiones