Risposta agli eventi - Pilastro dell'eccellenza operativa

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Risposta agli eventi

È consigliabile poter prevedere eventi operativi, sia previsti (ad esempio vendite promozionali, implementazioni e test di vulnerabilità) che imprevisti (ad esempio aumenti nell'utilizzo della soluzione ed errori nei suoi componenti). Si dovrebbero utilizzare runbook and playbook esistenti per fornire risultati coerenti nella risposta agli avvisi. Gli avvisi definiti dovrebbero essere controllati da un ruolo o da un team responsabile per la risposta e le escalation. Dovrai conoscere l'impatto aziendale dei componenti del tuo sistema e utilizzarlo per concentrare gli sforzi quando necessario. È necessario eseguire un'analisi della causa principale (RCA) dopo gli eventi e quindi prevenire il ripetersi di errori o soluzioni alternative relative ai documenti.

AWS semplifica la risposta agli eventi fornendo strumenti che supportano tutti gli aspetti del carico di lavoro e delle operazioni sotto forma di codice. Tali strumenti ti danno modo di scrivere script di risposta agli eventi delle operazioni e avviare la loro esecuzione in risposta ai dati di monitoraggio.

Inoltre AWS, è possibile migliorare i tempi di ripristino sostituendo i componenti guasti con versioni già valide, anziché provare a ripararli. Puoi eseguire l'analisi sulla risorsa guasta in un secondo momento fuori banda.