PERF05-BP07 Analisi dei parametri a intervalli regolari
Come manutenzione ordinaria o in risposta a eventi o incidenti, esamina quali parametri vengono raccolti. Stabilisci quali di questi parametri sono fondamentali per risolvere i problemi e quali altri parametri aggiuntivi, se monitorati, possono contribuire a identificare, affrontare o prevenire i problemi.
Anti-pattern comuni:
-
Lasci che i parametri rimangano in uno stato di allarme per un lungo periodo di tempo.
-
Crei allarmi che non sono utilizzabili da un sistema di automazione.
Vantaggi dell'adozione di questa best practice: Esamina continuamente i parametri raccolti per verificare che identifichino, risolvano o prevengano adeguatamente i problemi. I parametri possono anche diventare obsoleti se lasciati in uno stato di allarme per un lungo periodo di tempo.
Livello di rischio associato se questa best practice non fosse adottata: medio
Guida all'implementazione
Migliora continuamente la raccolta e il monitoraggio dei parametri. Nell'ambito della risposta a incidenti ed eventi, valuta quali parametri sono stati utili per affrontare il problema e quali sarebbero stati utili ma non sono attualmente misurati. Questo metodo ti aiuterà a migliorare la qualità dei parametri raccolti, in modo da prevenire o risolvere più rapidamente gli incidenti futuri.
Nell'ambito della risposta a incidenti ed eventi, valuta quali parametri sono stati utili per affrontare il problema e quali sarebbero stati utili ma non sono attualmente misurati. Queste considerazioni ti aiuteranno a migliorare la qualità dei parametri raccolti, per prevenire o risolvere più rapidamente gli incidenti futuri.
Passaggi dell'implementazione
-
Definisci metriche prestazionali critiche da monitorare in linea con il tuo obiettivo di carico di lavoro.
-
Imposta un valore di base e auspicabile per ogni metrica.
-
Imposta una cadenza (ad esempio settimanale o mensile) per rivedere le metriche più critiche.
-
Durante ogni revisione, valuta le tendenze e la deviazione dai valori di base. Cerca eventuali rallentamenti o anomalie nelle prestazioni.
-
Per i problemi identificati, esegui un'analisi approfondita delle cause principali per comprendere il motivo più importante alla base del problema.
-
Documenta gli esiti e utilizza strategie per affrontare i problemi e i rallentamenti identificati.
-
Valuta e migliora continuamente il processo di revisione delle metriche.
Risorse
Documenti correlati:
Video correlati:
Esempi correlati: