Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Risposta agli eventi
È consigliabile poter prevedere eventi operativi, sia previsti (ad esempio vendite promozionali, implementazioni e test di vulnerabilità) che imprevisti (ad esempio aumenti nell'utilizzo della soluzione ed errori nei suoi componenti). Si dovrebbero utilizzare runbook and playbook esistenti per fornire risultati coerenti nella risposta agli avvisi. Gli avvisi definiti dovrebbero essere controllati da un ruolo o da un team responsabile per la risposta e le escalation. Dovrai conoscere l'impatto aziendale dei componenti del tuo sistema e utilizzarlo per concentrare gli sforzi quando necessario. È necessario eseguire un'analisi della causa principale (RCA) dopo gli eventi e quindi prevenire il ripetersi di errori o soluzioni alternative relative ai documenti.
AWS semplifica la risposta agli eventi fornendo strumenti che supportano tutti gli aspetti del carico di lavoro e delle operazioni sotto forma di codice. Tali strumenti ti danno modo di scrivere script di risposta agli eventi delle operazioni e avviare la loro esecuzione in risposta ai dati di monitoraggio.
Inoltre AWS, è possibile migliorare i tempi di ripristino sostituendo i componenti guasti con versioni già valide, anziché provare a ripararli. Puoi eseguire l'analisi sulla risorsa guasta in un secondo momento fuori banda.
Best practice
- OPS10-BP01 Utilizzare un processo per la gestione di eventi, incidenti e problemi
- OPS10-BP02 Avere un processo per avviso
- OPS10-BP03 Assegna priorità agli eventi operativi in base all'impatto aziendale
- OPS10-BP04 Definire i percorsi di escalation
- OPS10-BP05 Definire un piano di comunicazione con i clienti per gli eventi che hanno un impatto sui servizi
- OPS10-BP06 Comunicazione dello stato tramite dashboard
- OPS10-BP07 Automatizza le risposte agli eventi