Scalabilità automatica del parco istanze - Hosting di applicazioni Web in AWS Cloud

Scalabilità automatica del parco istanze

Una delle principali differenze tra l'architettura di AWS Cloud e il modello di hosting tradizionale è che AWS offre scalabilità automatica del parco istanze dell'applicazione Web on demand per far fronte ai cambiamenti del traffico. Con il modello di hosting tradizionale, vengono in genere usati modelli di previsione del traffico per effettuare il provisioning degli host in anticipo rispetto al traffico previsto. In AWS è possibile effettuare il provisioning delle istanze in tempo reale in base a un set di meccanismi di attivazione tramite cui dimensionare il parco istanze aumentando o diminuendo la capacità.

Il servizio Auto Scaling permette di creare gruppi di capacità di server che è possibile aumentare o ridurre on demand. Auto Scaling funziona anche direttamente con CloudWatch per i dati dei parametri e con Elastic Load Balancing per l'aggiunta e la rimozione di host per la distribuzione del carico. Se, ad esempio, i server Web segnalano un utilizzo della CPU superiore all'80% in un determinato periodo di tempo, è possibile implementare rapidamente un server Web aggiuntivo e quindi aggiungerlo automaticamente al bilanciatore del carico in modo da inserirlo immediatamente nella rotazione di bilanciamento del carico.

Come illustrato nel modello di architettura di hosting Web AWS, è possibile creare più gruppi Auto Scaling per diversi livelli dell'architettura, in modo che ogni livello possa essere dimensionato in modo indipendente. Il gruppo Auto Scaling del server Web può ad esempio attivare il dimensionamento in risposta alle modifiche nell'I/O di rete, mentre il gruppo Auto Scaling del server applicazioni può aumentare orizzontalmente la capacità in base all'utilizzo della CPU. È possibile impostare valori minimi e massimi per assicurare la disponibilità 24 ore su 24, 7 giorni su 7 e per limitare l'utilizzo all'interno di un gruppo.

I meccanismi di attivazione di Auto Scaling possono essere impostati sia per aumentare che per ridurre il parco istanze totale in un determinato livello in modo da far corrispondere l'utilizzo delle risorse alla domanda effettiva. Oltre al servizio Auto Scaling, puoi dimensionare i parchi istanze Amazon EC2 direttamente tramite l'API di Amazon EC2, che permette di avviare, terminare e ispezionare le istanze.