Escalado automático de la flota - Alojamiento de aplicaciones web en la nube de AWS

Escalado automático de la flota

Una de las diferencias clave entre la arquitectura en la nube de AWS y el modelo de alojamiento tradicional es que AWS puede escalar automáticamente la flota de aplicaciones web bajo demanda para gestionar los cambios en el tráfico. En el modelo de alojamiento tradicional, suelen utilizarse modelos de previsión de tráfico para aprovisionar los hosts de acuerdo con el tráfico previsto. En AWS, las instancias se pueden aprovisionar sobre la marcha de acuerdo con un conjunto de desencadenadores para aumentar y reducir la flota.

El servicio Auto Scaling puede crear grupos de capacidad de servidores que pueden aumentar o reducirse según la demanda. Auto Scaling también funciona directamente con CloudWatch para ofrecer datos de métricas y con Elastic Load Balancing para añadir y eliminar hosts para la distribución de la carga. Por ejemplo, si los servidores web informan que la utilización de CPU es superior al 80 por ciento durante un período de tiempo, se podría implementar rápidamente un servidor web adicional y, a continuación, añadirlo automáticamente al equilibrador de carga para incluirlo inmediatamente en la rotación del equilibrio de carga.

Como se muestra en el modelo de arquitectura de alojamiento web de AWS, puede crear varios grupos de Auto Scaling para diferentes capas de la arquitectura, de modo que cada capa se pueda escalar de forma independiente. Por ejemplo, el grupo de Auto Scaling del servidor web puede activar el escalado horizontal y vertical en respuesta a los cambios en las operaciones de E/S de la red, mientras que el grupo de Auto Scaling del servidor de aplicaciones podría escalarse horizontal y verticalmente en función del uso de la CPU. Puede establecer mínimos y máximos para ayudar a garantizar la disponibilidad las 24 horas del día y los 7 días de la semana y limitar el uso dentro de un grupo.

Los desencadenadores de Auto Scaling se pueden configurar tanto para aumentar como para reducir la flota total en una capa determinada para adaptar la utilización de los recursos a la demanda real. Además del servicio Auto Scaling, puede escalar flotas de Amazon EC2 directamente a través de la API de Amazon EC2, lo que permite lanzar, terminar e inspeccionar instancias.