PERF05-BP05 Uso dell'automazione per risolvere in modo proattivo i problemi relativi alle prestazioni - Framework AWS Well-Architected

PERF05-BP05 Uso dell'automazione per risolvere in modo proattivo i problemi relativi alle prestazioni

Utilizza indicatori chiave di prestazioni (KPI), in combinazione con sistemi di monitoraggio e allarmi, per risolvere in modo proattivo i problemi correlati alle prestazioni.

Anti-pattern comuni:

  • Consenti solo al personale operativo di apportare modifiche operative al carico di lavoro.

  • Lasci che tutti gli allarmi giungano direttamente al team operativo senza alcuna correzione proattiva.

Vantaggi dell'adozione di questa best practice: La correzione proattiva delle azioni di allarme consente al personale di supporto di concentrarsi sugli elementi che non sono attivabili automaticamente. In questo modo, il personale operativo non viene sovraccaricato da tutti gli allarmi e si concentra, invece, solo sugli allarmi critici.

Livello di rischio associato se questa best practice non fosse adottata: basso

Guida all'implementazione

Laddove possibile, utilizza gli allarmi per attivare operazioni automatizzate per risolvere i problemi. Se non è possibile rispondere in modo automatizzato, inoltra l'allarme a coloro che possono intervenire. Ad esempio, puoi implementare un sistema in grado di prevedere i valori attesi per gli indicatori chiave di prestazioni (KPI) e di inviare allarmi qualora essi oltrepassino determinate soglie, oppure uno strumento che arresta o esegue automaticamente il rollback delle implementazioni nel caso in cui i valori dei KPI si discostino dai valori attesi.

Implementa processi che forniscono visibilità sulle prestazioni durante l'esecuzione del carico di lavoro. Crea pannelli di controllo del monitoraggio e stabilisci norme di riferimento per le aspettative riguardanti le prestazioni, per determinare se il carico di lavoro ha prestazioni ottimali.

Passaggi dell'implementazione

  • Individua e comprendi il problema delle prestazioni che può essere risolto automaticamente. Utilizza soluzioni di monitoraggio di AWS come Amazon CloudWatch o AWS X-Ray per aiutarti a comprendere meglio la causa principale del problema.

  • Crea un piano e un processo di risoluzione dettagliato che possono essere utilizzati per risolvere automaticamente il problema.

  • Configura il trigger per avviare automaticamente il processo di risoluzione. Ad esempio, è possibile definire un trigger per riavviare automaticamente un'istanza quando raggiunge una determinata soglia di utilizzo della CPU.

  • Utilizza i servizi e le tecnologie AWS per automatizzare il processo di risoluzione. Ad esempio, AWS Systems Manager Automation fornisce un modo sicuro e scalabile per automatizzare il processo di risoluzione.

  • Esegui il test del processo di risoluzione automatizzato in un ambiente di preproduzione.

  • Dopo i test, implementa il processo di risoluzione nell'ambiente di produzione e monitora continuamente per individuare le aree di miglioramento.

Risorse

Documenti correlati:

Video correlati:

Esempi correlati: