Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Políticas de Auto Scaling
Una directiva de escalado tiene los siguientes componentes:
-
Una métrica objetivo: la CloudWatch métrica que ElastiCache Auto Scaling OSS de Valkey y Redis utiliza para determinar cuándo y cuánto escalar.
-
Capacidad mínima y máxima: el número mínimo y máximo de particiones o réplicas que se utilizarán para el escalado.
importante
Al crear la política de escalado automático, si la capacidad actual es superior a la capacidad máxima configurada, la aplicamos MaxCapacity durante la creación de la política. Del mismo modo, si la capacidad actual es inferior a la capacidad mínima configurada, escalamos hacia fuera hasta la. MinCapacity
-
Un periodo de recuperación: la cantidad de tiempo, en segundos, tras completarse una actividad de reducción o escalado horizontal antes de que pueda comenzar otra actividad de escalado horizontal.
-
Un rol vinculado a un servicio: un rol de AWS Identity and Access Management (IAM) que está vinculado a un servicio específico. AWS Un rol vinculado a un servicio incluye todos los permisos que el servicio requiere para llamar a otros AWS servicios en tu nombre. ElastiCache Auto Scaling genera automáticamente este rol para usted.
AWSServiceRoleForApplicationAutoScaling_ElastiCacheRG
-
Habilitar o deshabilitar actividades de reducción horizontal: permite habilitar o deshabilitar actividades de reducción horizontal para una política.
Temas
Métrica de destino para Auto Scaling
En este tipo de política, se especifican una métrica predefinida o personalizada y un valor objetivo para la métrica en una configuración de política de escalado de seguimiento de objetivos. ElastiCache para Valkey y Redis, OSS Auto Scaling crea y gestiona CloudWatch las alarmas que activan la política de escalado y calcula el ajuste de escalado en función de la métrica y el valor objetivo. La política de escalado agrega o elimina shards/replicas según sea necesario para mantener la métrica en el valor objetivo especificado o cerca de él. Además de mantener la métrica próxima al valor de destino, la política de escalado de seguimiento de destino también se ajusta a las fluctuaciones de la métrica producidas por una carga de trabajo en constante cambio. Esta política también minimiza las fluctuaciones rápidas en la cantidad de recursos disponibles shards/replicas para el clúster.
Por ejemplo, considere una política de escalado que utilice la métrica ElastiCachePrimaryEngineCPUUtilization
media predefinida. Esta política puede mantener la utilización de la CPU en el porcentaje de utilización especificado o en un valor próximo, como el 70 %.
nota
Para cada clúster, puede crear solo una política de Auto Scaling para cada métrica de destino.
Capacidad mínima y máxima
Particiones
Puede especificar la cantidad máxima de fragmentos a los que se puede escalar ElastiCache para el autoescalado de Valkey y Redis OSS. Este valor debe ser igual o inferior a 250 con un mínimo de 1. También puede especificar el número mínimo de particiones que va a administrar por medio del escalado automático. Este valor debe ser al menos 1, e igual o inferior al valor especificado para el máximo de 250 particiones.
Réplicas
Puede especificar el número máximo de réplicas que administrará para el autoescalado ElastiCache de Valkey y Redis OSS. Este valor debe ser igual o inferior a 5. También puede especificar el número mínimo de réplicas que va a administrar mediante el escalado automático. Este valor debe ser al menos 1, e igual o inferior al valor especificado para el máximo de 5 réplicas.
Para determinar la cantidad mínima y máxima shards/replicas que necesita para el tráfico típico, pruebe la configuración de Auto Scaling con la velocidad de tráfico esperada para su modelo.
nota
ElastiCache las políticas de escalado automático aumentan la capacidad del clúster hasta que alcance el tamaño máximo definido o hasta que se apliquen los límites de servicio. Para solicitar un aumento del límite, consulte AWS Service Limits y elija el tipo de límite Nodes per cluster per instance type (Nodos por clúster por tipo de instancias).
importante
La reducción horizontal sucede cuando no hay tráfico. Si el tráfico de una variante se reduce a cero, se escala ElastiCache automáticamente hasta el número mínimo de instancias especificado.
Periodo de recuperación
Puede ajustar la capacidad de respuesta de una política de escalado de seguimiento de destino al agregar periodos de recuperación que afecten al escalado de su clúster. Un periodo de recuperación bloquea solicitudes de escalado descendente o ascendente posteriores hasta que vence el periodo. Esto ralentiza las eliminaciones shards/replicas en el clúster de OSS de Valkey y Redis en el caso de las solicitudes de escalamiento interno y la creación de las solicitudes de escalado horizontal. ElastiCache shards/replicas Puede especificar los siguientes periodos de recuperación:
-
Una actividad de escalado interno reduce la cantidad de componentes del clúster. shards/replicas Un periodo de recuperación de escalado descendente especifica la cantidad de tiempo, en segundos, tras completarse una actividad de escalado descendente antes de que pueda comenzar otra actividad de escalado descendente.
-
Una actividad de escalamiento horizontal aumenta la cantidad de shards/replicas personas en el clúster. Un periodo de recuperación de escalado ascendente especifica la cantidad de tiempo, en segundos, tras completarse una actividad de escalado ascendente antes de que pueda comenzar otra actividad de escalado ascendente.
Si no se especifica un periodo de recuperación de reducción o escalado horizontal, el valor predeterminado del escalado horizontal es de 600 segundos y de la reducción horizontal es de 900 segundos.
Activar o desactivar actividades de escalado descendente
Puede habilitar o deshabilitar actividades de escalado descendente para una política. Al habilitar las actividades de escalado interno, se puede eliminar la política de escalado. shards/replicas. When scale-in activities are enabled, the scale-in cooldown period in the scaling policy applies to scale-in activities. Disabling scale-in activities prevents the scaling policy from deleting shards/replicas
nota
Las actividades de escalado horizontal siempre están habilitadas para que la política de escalado pueda crear ElastiCache fragmentos o réplicas según sea necesario.