Scalabilité automatique de la flotte
L'une des principales différences entre l'architecture cloud AWS et le modèle d'hébergement traditionnel est qu'AWS peut automatiquement mettre à l'échelle la flotte d'applications web à la demande pour gérer les changements de trafic. Dans le modèle d'hébergement traditionnel, les modèles de prévisions de trafic sont généralement utilisés pour allouer des hôtes à l'avance. Dans AWS, les instances peuvent être allouées à la volée en fonction d'un ensemble de déclencheurs permettant de mettre à l'échelle la flotte qui sort et revient.
Le service Auto Scaling
Comme montré dans le modèle d'architecture d'hébergement web AWS, plusieurs groupes Auto Scaling peuvent être créés pour différentes couches de l'architecture afin de permettre à chaque couche une mise à l'échelle indépendante. Par exemple, le groupe Auto Scaling du serveur web peut déclencher une augmentation ou une réduction en réponse à des modifications des I/O réseau, tandis que le groupe Auto Scaling du serveur d'applications peut augmenter et réduire en fonction de l'utilisation du CPU. Vous pouvez définir des minimums et des maximums pour garantir une disponibilité 24 h/24 et 7 j/7, et limiter l'utilisation au sein d'un groupe.
Les déclencheurs Auto Scaling peuvent être configurés pour augmenter et réduire la flotte totale à une couche donnée afin d'adapter l'utilisation des ressources à la demande réelle. Outre le service Auto Scaling, vous pouvez mettre à l'échelle les flottes Amazon EC2 directement via l'API Amazon EC2, qui permet de lancer, de mettre fin et d'inspecter des instances.