OPS10-BP07 Automazione delle risposte agli eventi
L'automazione delle risposte agli eventi è fondamentale per una gestione operativa rapida, coerente e priva di errori. Crea processi semplificati e utilizza strumenti per gestire e rispondere automaticamente agli eventi, riducendo al minimo gli interventi manuali e migliorando l'efficacia operativa.
Risultato desiderato:
-
Riduzione degli errori umani e tempi di risoluzione più rapidi grazie all'automazione.
-
Gestione degli eventi operativi coerente e affidabile.
-
Maggiore efficienza operativa e affidabilità del sistema.
Anti-pattern comuni:
-
La gestione manuale degli eventi comporta ritardi ed errori.
-
L'automazione viene trascurata nelle attività ripetitive e critiche.
-
Le attività manuali ripetitive causano affaticamento da avvisi e la mancata identificazione di problemi critici.
Vantaggi dell'adozione di questa best practice:
-
Risposte agli eventi accelerate, riduzione dei tempi di inattività del sistema.
-
Operazioni affidabili con gestione automatizzata e coerente degli eventi.
Livello di rischio associato se questa best practice non fosse adottata: medio
Guida all'implementazione
Incorpora l'automazione per creare flussi di lavoro operativi efficienti e ridurre al minimo gli interventi manuali.
Passaggi dell'implementazione
-
Identifica le opportunità di automazione: Definisci le attività ripetitive da automatizzare, come la risoluzione dei problemi, l'arricchimento dei ticket, la gestione della capacità, la scalabilità, le implementazioni e i test.
-
Identifica i prompt di automazione:
-
Valuta e definisci condizioni o metriche specifiche al verificarsi delle quali inviare risposte automatiche utilizzando le azioni di allarme di Amazon CloudWatch.
-
Utilizza Amazon EventBridge
per rispondere agli eventi nei servizi AWS, nei carichi di lavoro personalizzati e nelle applicazioni SaaS. -
Prendi in considerazione eventi scatenanti come voci di log specifiche, soglie delle metriche delle prestazionio cambiamenti di stato nelle risorse AWS.
-
-
Implementa l'automazione basata sugli eventi:
-
Usa i runbook di Automazione AWS Systems Manager per semplificare le attività di manutenzione, implementazione e bonifica.
-
Quando vengono creati incidenti in Incident Manager, i dettagli relativi alle risorse AWS coinvolte nell'incidente vengono raccolti e aggiunti automaticamente.
-
Monitora in modo proattivo le quote utilizzando Monitoraggio delle quote per AWS
. -
Regola automaticamente la capacità con AWS Auto Scaling
per mantenere la disponibilità e le prestazioni. -
Automatizza le pipeline di sviluppo con Amazon CodeCatalyst
. -
Smoke test o monitoraggio continuo di endpoint e API utilizzando il monitoraggio sintetico.
-
-
Esegui la mitigazione del rischio attraverso l'automazione:
-
Implementa risposte di sicurezza automatizzate
per affrontare rapidamente i rischi. -
Utilizza AWS Systems Manager State Manager per ridurre la deviazione delle configurazioni.
-
Livello di impegno per il piano di implementazione: alto
Risorse
Best practice correlate:
Documenti correlati:
Video correlati:
Esempi correlati: