Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Appendice B ‒ Misure quantitative e qualitative
Questa sezione descrive le metriche quantitative per tenere traccia dei miglioramenti operativi e le misure qualitative per valutare i risultati organizzativi più ampi derivanti dalle pratiche di ingegneria del caos.
Misure quantitative
Le seguenti misure quantitative forniscono un quadro per il monitoraggio delle metriche chiave in grado di dimostrare gli incidenti diretti e i miglioramenti operativi raggiunti attraverso le pratiche di ingegneria del caos:
-
Incidenti:
-
Frequenza degli incidenti ‒ Tieni traccia del numero di incidenti all'interno di un quadro di classificazione degli incidenti e li classifica in base alla loro criticità (critica, grave, minore) per un periodo di tempo. Per ulteriori informazioni sul quadro di classificazione degli incidenti, vedere l'Appendice C.
-
Tempi di inattività e degrado ‒ Misura la durata totale del downtime o del degrado del servizio per ogni classificazione degli incidenti.
-
Metriche di risposta agli incidenti ‒ Per comprendere gli incidenti, misura il tempo di rilevamento, il tempo di identificazione, il tempo di mitigazione, il tempo di ripristino, il tempo di intensificazione e altre metriche correlate per ogni classificazione degli incidenti.
-
Incidenti con impatto sui clienti ‒ Tieni traccia del numero di incidenti che hanno un impatto sui clienti o della percentuale di incidenti che erano stati risolti prima dell'impatto sui clienti.
-
Modifiche al runbook ‒ Tieni traccia del numero di aggiornamenti o revisioni del runbook derivanti dalle informazioni acquisite attraverso esperimenti di caos. Un runbook fornisce istruzioni dettagliate per eseguire una particolare operazione o procedura per il ripristino da un particolare tipo di incidente.
-
-
Costi:
-
Costi dell'infrastruttura ‒ Raccogli dati sui costi dell'infrastruttura, comprese le risorse di cloud computing e le misure di ridondanza richieste dalle azioni intraprese per migliorare la resilienza.
-
Impatto sul cliente ‒ Misura gli impatti sull'esperienza del cliente, i tassi di abbandono e le perdite di entrate associate a guasti del sistema o tempi di inattività.
-
Produttività del personale ‒ Tieni traccia del tempo impiegato dai team tecnici e operativi per la risposta agli incidenti, la lotta antincendio, la stesura di autopsie e altre attività reattive relative ai guasti del sistema.
-
-
Miglioramenti continui del sistema ‒ Conta il numero di miglioramenti dei processi, modifiche all'architettura o meccanismi di ripristino automatizzati implementati come risultato diretto delle informazioni ottenute da esperimenti sul caos.
-
Conformità ‒ Tieni traccia dei costi e lavora per soddisfare i requisiti normativi o gli standard di settore relativi alla resilienza operativa.
-
Adozione ‒ Monitora il tasso di adozione delle pratiche legate al caos in tutta l'organizzazione.
-
Soddisfazione del cliente ‒ Misura i cambiamenti nelle metriche di soddisfazione dei clienti per valutare in che modo una maggiore affidabilità del sistema influisce sull'azienda.
Misure qualitative
Le seguenti misure qualitative forniscono un quadro per tracciare i più ampi risultati organizzativi raggiunti attraverso le pratiche di ingegneria del caos:
-
Fiducia e preparazione dei dipendenti:
-
Sondaggi periodici tra i team per misurare il loro livello di fiducia nella gestione degli incidenti del mondo reale e la loro predisposizione percepita alle interruzioni di chiamata.
-
Tieni traccia della percentuale di tecnici a chiamata che hanno partecipato a esperimenti sul caos nell'ambito della loro formazione.
-
-
Cambiamento culturale:
-
Valuta il grado in cui una mentalità di resilienza ha permeato l'organizzazione attraverso sondaggi, sessioni di feedback o audit.
-
Tieni traccia del numero di team che difendono e difendono attivamente le pratiche di ingegneria del caos.
-
-
Collaborazione interfunzionale e condivisione delle conoscenze:
-
Tieni traccia della frequenza e della partecipazione alle sessioni o ai workshop di condivisione delle conoscenze tra team relativi all'apprendimento dell'ingegneria del caos.
-
Tieni traccia del numero di iniziative congiunte di ingegneria del caos che coinvolgono più team o reparti.
-
-
Efficacia della formazione:
-
Valuta l'efficacia dei programmi di formazione sull'ingegneria del caos conducendo sondaggi o valutazioni post-formazione.
-
Tieni traccia del numero di ingegneri che partecipano ai programmi di formazione sull'ingegneria del caos e leggi le autopsie.
-
-
Attrazione e fidelizzazione dei talenti:
-
Valuta se il programma di ingegneria del caos aiuta ad attrarre e fidelizzare i migliori talenti ingegneristici riducendo il tempo e gli sforzi spesi per risolvere le interruzioni.
-
-
Reputazione del marchio:
-
Tieni traccia di eventuali cambiamenti nella percezione o nella reputazione del marchio correlati all'impegno dimostrato dell'organizzazione per la resilienza operativa.
-
-
Vantaggio competitivo:
-
Tieni traccia del vantaggio competitivo rispetto ai concorrenti del settore in termini di disponibilità del sistema.
-