Escalado automático de la flota
Una de las diferencias clave entre la arquitectura en la nube de AWS y el modelo de alojamiento tradicional es que AWS puede escalar automáticamente la flota de aplicaciones web bajo demanda para gestionar los cambios en el tráfico. En el modelo de alojamiento tradicional, suelen utilizarse modelos de previsión de tráfico para aprovisionar los hosts de acuerdo con el tráfico previsto. En AWS, las instancias se pueden aprovisionar sobre la marcha de acuerdo con un conjunto de desencadenadores para aumentar y reducir la flota.
El servicio Auto Scaling
Como se muestra en el modelo de arquitectura de alojamiento web de AWS, puede crear varios grupos de Auto Scaling para diferentes capas de la arquitectura, de modo que cada capa se pueda escalar de forma independiente. Por ejemplo, el grupo de Auto Scaling del servidor web puede activar el escalado horizontal y vertical en respuesta a los cambios en las operaciones de E/S de la red, mientras que el grupo de Auto Scaling del servidor de aplicaciones podría escalarse horizontal y verticalmente en función del uso de la CPU. Puede establecer mínimos y máximos para ayudar a garantizar la disponibilidad las 24 horas del día y los 7 días de la semana y limitar el uso dentro de un grupo.
Los desencadenadores de Auto Scaling se pueden configurar tanto para aumentar como para reducir la flota total en una capa determinada para adaptar la utilización de los recursos a la demanda real. Además del servicio Auto Scaling, puede escalar flotas de Amazon EC2 directamente a través de la API de Amazon EC2, lo que permite lanzar, terminar e inspeccionar instancias.