PERF05-BP07 Analisi dei parametri a intervalli regolari - Framework AWS Well-Architected

PERF05-BP07 Analisi dei parametri a intervalli regolari

Come manutenzione ordinaria o in risposta a eventi o incidenti, esamina quali parametri vengono raccolti. Stabilisci quali di questi parametri sono fondamentali per risolvere i problemi e quali altri parametri aggiuntivi, se monitorati, possono contribuire a identificare, affrontare o prevenire i problemi.

Anti-pattern comuni:

  • Lasci che i parametri rimangano in uno stato di allarme per un lungo periodo di tempo.

  • Crei allarmi che non sono utilizzabili da un sistema di automazione.

Vantaggi dell'adozione di questa best practice: Esamina continuamente i parametri raccolti per verificare che identifichino, risolvano o prevengano adeguatamente i problemi. I parametri possono anche diventare obsoleti se lasciati in uno stato di allarme per un lungo periodo di tempo.

Livello di rischio associato se questa best practice non fosse adottata: medio

Guida all'implementazione

Migliora continuamente la raccolta e il monitoraggio dei parametri. Nell'ambito della risposta a incidenti ed eventi, valuta quali parametri sono stati utili per affrontare il problema e quali sarebbero stati utili ma non sono attualmente misurati. Questo metodo ti aiuterà a migliorare la qualità dei parametri raccolti, in modo da prevenire o risolvere più rapidamente gli incidenti futuri.

Nell'ambito della risposta a incidenti ed eventi, valuta quali parametri sono stati utili per affrontare il problema e quali sarebbero stati utili ma non sono attualmente misurati. Queste considerazioni ti aiuteranno a migliorare la qualità dei parametri raccolti, per prevenire o risolvere più rapidamente gli incidenti futuri.

Passaggi dell'implementazione

  1. Definisci metriche prestazionali critiche da monitorare in linea con il tuo obiettivo di carico di lavoro.

  2. Imposta un valore di base e auspicabile per ogni metrica.

  3. Imposta una cadenza (ad esempio settimanale o mensile) per rivedere le metriche più critiche.

  4. Durante ogni revisione, valuta le tendenze e la deviazione dai valori di base. Cerca eventuali rallentamenti o anomalie nelle prestazioni.

  5. Per i problemi identificati, esegui un'analisi approfondita delle cause principali per comprendere il motivo più importante alla base del problema.

  6. Documenta gli esiti e utilizza strategie per affrontare i problemi e i rallentamenti identificati.

  7. Valuta e migliora continuamente il processo di revisione delle metriche.

Risorse

Documenti correlati:

Video correlati:

Esempi correlati: