Come funzionano i piani di dimensionamento - AWS Auto Scaling

Come funzionano i piani di dimensionamento

AWS Auto Scaling ti permette di utilizzare piani di dimensionamento per configurare un insieme di istruzioni per il dimensionamento delle proprie risorse. Se si lavora con AWS CloudFormation o si aggiungono tag a risorse scalabili, è possibile impostare piani di dimensionamento per diversi set di risorse, per applicazione. La console di AWS Auto Scaling fornisce suggerimenti per le strategie di dimensionamento personalizzate per ciascuna risorsa. Dopo aver creato i piani di dimensionamento, unisce i metodi di dimensionamento dinamici e predittivi a supporto della strategia di dimensionamento.

Cos'è una strategia di dimensionamento?

La strategia di dimensionamento indica a AWS Auto Scaling come ottimizzare l'utilizzo delle risorse nel piano di dimensionamento. È possibile ottimizzare la disponibilità, il costo o un equilibrio di entrambi. In alternativa, puoi creare strategie personalizzate in funzione dei parametri e delle soglie definiti. È possibile impostare delle strategie separate per ciascuna risorsa o per tipo di risorsa.

Che cos'è il dimensionamento dinamico?

Il dimensionamento dinamico crea policy di dimensionamento di monitoraggio obiettivo per le risorse nel piano di dimensionamento. Tali policy di dimensionamento regolano la capacità di risorse in risposta alle variazioni di utilizzo delle risorse. L'obiettivo è fornire capacità sufficiente per mantenere l'utilizzo delle risorse entro il valore obiettivo specificato dalla strategia di dimensionamento. Questa operazione può essere paragonata al modo in cui il termostato regola la temperatura di una casa. Tu selezioni la temperatura, il termostato si occupa del resto.

Ad esempio, è possibile configurare il piano di dimensionamento e mantenere il numero di operazioni che il Amazon Elastic Container Service (Amazon ECS) esegue al 75% di CPU. Quando l'utilizzo della CPU del servizio supera il 75% (ossia più del 75% della CPU riservata per il servizio in uso), questo attiva la policy di dimensionamento e aggiunge un'altra attività al servizio che possa aiutarti con il picco di carico.

Che cos'è il dimensionamento predittivo?

Il dimensionamento predittivo usa il machine learning per analizzare il carico di lavoro storico di ogni risorsa ed esegue regolarmente previsioni di carico futuro. Questo è simile a come funzionano le previsioni meteorologiche. Utilizzando la previsione, il dimensionamento predittivo genera operazioni programmate di dimensionamento per assicurare che le capacità delle risorse siano disponibili prima che la tua applicazione ne abbia bisogno. Come nel dimensionamento dinamico, il dimensionamento predittivo lavora per mantenere l'utilizzo al valore target specificato dalla strategia di dimensionamento.

Ad esempio, puoi abilitare il dimensionamento predittivo e configurare la tua strategia di dimensionamento per mantenere l'utilizzo medio della CPU del gruppo Auto Scaling al 50%. Considera una previsione in base alla quale i picchi di traffico si verificano ogni giorno alle 8 del mattino. Il piano di dimensionamento crea le operazioni di dimensionamento programmate future per assicurare che il gruppo Auto Scaling sia pronto a gestire il traffico in anticipo. Questo aiuta a mantenere le prestazioni dell'applicazione costanti, con l'obiettivo di avere sempre la capacità richiesta per mantenere l'utilizzo delle risorse il più possibile vicino al 50% in qualsiasi momento.

Di seguito sono riportati i concetti chiave per comprendere il dimensionamento predittivo:

  • Caricamento delle previsioni: AWS Auto Scaling analizza fino a 14 giorni di storico per un determinato parametro di carico e prevede la domanda futura per i due giorni successivi. Questi dati sono disponibili in intervalli di un'ora e vengono aggiornati quotidianamente.

  • Operazioni di dimensionamento programmate: AWS Auto Scaling pianifica le operazioni di dimensionamento che aumentano e diminuiscono in modo proattivo capacità delle risorse in base alle previsioni di carico. Al momento previsto, AWS Auto Scaling aggiorna la capacità minima della risorsa con il valore specificato dall'operazione di dimensionamento programmata. L'obiettivo è mantenere l'utilizzo delle risorse entro il valore obiettivo specificato dalla strategia di dimensionamento. Se la tua applicazione richiede una capacità superiore rispetto a quella prevista, il dimensionamento dinamico è disponibile per aggiungere ulteriore capacità.

  • Comportamento di capacità massima: i limiti di capacità minima e massima per la scalabilità automatica si applicano a ciascuna risorsa. Tuttavia, è possibile controllare se la tua applicazione è in grado di aumentare la capacità oltre quella massima quando la capacità di previsione è superiore alla massima.

Nota

Ora è possibile utilizzare le policy di dimensionamento predittivo dei gruppi Auto Scaling. Per ulteriori informazioni, consulta Dimensionamento predittivo per Dimensionamento automatico Amazon EC2 nella Guida per l'utente di Dimensionamento automatico Amazon EC2.