Introducción a Auto Scaling de aplicaciones - Application Auto Scaling

Introducción a Auto Scaling de aplicaciones

En este tema se explican los conceptos clave que le ayudarán a aprender acerca del Auto Scaling de aplicaciones y a empezar a utilizarlo.

Destinos escalables

Entidad que se crea para especificar el recurso que desea escalar. Cada destino escalable se identifica de forma única mediante un espacio de nombres de servicio, un ID de recurso y una dimensión escalable, que representa alguna dimensión de capacidad del servicio subyacente. Por ejemplo, un Servicio ECS de Amazon admite el escalado automático de su recuento de tareas, una tabla de DynamoDB admite el escalado automático de la capacidad de lectura y escritura de la tabla y sus índices secundarios globales, y un clúster de Aurora admite el escalado de su recuento de réplicas.

sugerencia

Cada objetivo escalable también tiene una capacidad mínima y máxima. Las políticas de escalado nunca irán más alto o más bajo que el rango mínimo máximo. Puede realizar cambios fuera de banda directamente en el recurso subyacente que está fuera de este rango, del que no conoce Auto Scaling de aplicaciones. Sin embargo, cada vez que se invoca una política de escalado o se llama a la API RegisterScalableTarget, Auto Scaling de aplicaciones recupera la capacidad actual y la compara con la capacidad mínima y máxima. Si está fuera del rango mínimo máximo, la capacidad se actualiza para cumplir con el mínimo y máximo establecido.

Reducción horizontal

Cuando Auto Scaling de aplicaciones disminuye automáticamente la capacidad de un destino escalable, el destino escalable se reduce horizontalmente. Cuando se establecen políticas de escalamiento, no pueden reducir horizontalmente el objetivo escalable por debajo de su capacidad mínima.

Escalado ascendente

Cuando Auto Scaling de aplicaciones aumenta automáticamente la capacidad de un destino escalable, el destino escalable escala horizontalmente. Cuando se establecen políticas de escalamiento, no pueden escalar horizontalmente el objetivo escalable por encima de su capacidad máxima.

Política de escalado

Una política de escalado indica que Auto Scaling de aplicaciones debe realizar un seguimiento de una métrica específica de CloudWatch. A continuación, determina la acción de escala que se debe realizar cuando la métrica es superior o inferior a un determinado valor de umbral. Por ejemplo, es posible que desee escalar horizontalmente si el uso de la CPU en el clúster comienza a aumentar y reducir horizontalmente cuando vuelva a caer.

Las métricas que se utilizan para el escalado automático son publicadas por el servicio de destino, pero también puede publicar su propia métrica en CloudWatch y luego usarla con una política de escalado.

Un periodo de recuperación entre actividades de escalado permite que el recurso se estabilice antes de que comience otra actividad de escalado. Auto Scaling de aplicaciones continúa evaluando métricas durante el periodo de recuperación. Cuando finaliza el periodo de recuperación, la política de escalado inicia otra actividad de escalado si es necesario. Mientras esté vigente un periodo de recuperación si se necesita una escala horizontal mayor en rol del valor de la métrica actual, la política de escalado se escala horizontalmente inmediatamente.

Acción programada

Las acciones programadas escalan automáticamente los recursos en una fecha y hora específicas. Funcionan modificando la capacidad mínima y máxima de un destino escalable y, por lo tanto, se pueden utilizar para reducir horizontalmente y escalar horizontalmente de una programación estableciendo la capacidad mínima alta o la capacidad máxima baja. Por ejemplo, puede usar acciones programadas para escalar una aplicación que no consume recursos los fines de semana reduciendo la capacidad el viernes y aumentando la capacidad el lunes siguiente.

También puede utilizar acciones programadas para optimizar los valores mínimo y máximo a lo largo del tiempo para adaptarse a situaciones en las que se espera un tráfico superior al normal, por ejemplo, campañas de marketing o fluctuaciones estacionales. Esto puede ayudarlo a mejorar el rendimiento en los momentos en que necesita escalar horizontalmente más alto para aumentar el uso y reducir los costos en momentos en que utiliza menos recursos.

Más información

Servicios de AWS que puede utilizar con Auto Scaling de aplicaciones: Esta sección le presenta los servicios que puede escalar y le ayuda a configurar el escalado automático registrando un destino escalable. También describe cada uno de los roles vinculados al servicio de IAM que crea Auto Scaling de aplicaciones para acceder a los recursos del servicio de destino.

Políticas de escalado de seguimiento de destino para Auto Scaling de aplicaciones: Una de las principales características de Auto Scaling de aplicaciones es las políticas de escalado de seguimiento de destino. Descubra cómo las políticas de seguimiento de destinos ajustan automáticamente la capacidad deseada para mantener la utilización en un nivel constante en rol de sus métricas y valores de destino configurados. Por ejemplo, puede configurar el seguimiento de destino para mantener el uso de la CPU para su flota de spot web en un 50 %. A continuación,Auto Scaling de aplicaciones lanza o finaliza instancias EC2 según sea necesario para mantener la utilización agregada de la CPU en todos los servidores en un 50 %.