Cos'è AWS Incident Detection and Response? - AWSGuida per l'utente di rilevamento e risposta agli incidenti

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Cos'è AWS Incident Detection and Response?

AWS Incident Detection and Response offre ai clienti idonei di AWS Enterprise Support un coinvolgimento proattivo degli incidenti per ridurre il potenziale di guasto e accelerare il ripristino dei carichi di lavoro critici in caso di interruzioni. Incident Detection and Response facilita la collaborazione AWS per sviluppare runbook e piani di risposta personalizzati per ogni carico di lavoro integrato. Un team di Incident Management Engineer (IME) monitora i carichi di lavoro integrati 24 ore su 24, 7 giorni su 7 e ti coinvolge su un call bridge entro 5 minuti da un allarme critico.

Incident Detection and Response offre le seguenti funzionalità chiave:

  • Migliore osservabilità: AWS gli esperti forniscono indicazioni per aiutarvi a definire e correlare metriche e allarmi tra i livelli applicativo e infrastrutturale del carico di lavoro per rilevare tempestivamente le interruzioni.

  • Tempo di risposta di 5 minuti: gli IME monitorano i carichi di lavoro integrati 24 ore su 24, 7 giorni su 7 per rilevare incidenti critici. Gli IME rispondono entro 5 minuti dall'attivazione di un allarme o in risposta a un caso di supporto di importanza critica per l'azienda da te segnalato a Incident Detection and Response.

  • Risoluzione più rapida: gli IME utilizzano runbook predefiniti e personalizzati sviluppati per i tuoi carichi di lavoro per rispondere entro 5 minuti, creare un caso di Support per tuo conto e gestire gli incidenti sul tuo carico di lavoro. Gli IME garantiscono la gestione degli incidenti in un unico thread e vi mantengono in contatto con gli esperti giusti fino alla risoluzione dell'incidente. AWS

  • Gestione degli incidenti per AWS gli eventi: poiché comprendiamo il contesto del carico di lavoro critico (ad esempio, account, servizi e istanze), possiamo rilevare e notificare in modo proattivo un potenziale impatto sul carico di lavoro durante un evento di servizio. AWS Se richiesto, gli IME coinvolgono l'utente durante gli eventi AWS di servizio e forniscono aggiornamenti sugli eventi. Sebbene Incident Detection and Response non possa dare priorità al ripristino durante un evento di servizio, Incident Detection and Response fornisce una guida di Support per aiutarti a implementare il tuo piano di mitigazione.

  • Riduzione del rischio di guasto: dopo la risoluzione, gli IME forniscono una revisione post-incidente (su richiesta). Inoltre, gli AWS esperti collaborano con voi per applicare le lezioni apprese per migliorare il piano di risposta agli incidenti e i runbook. Puoi anche sfruttare AWS Resilience Hub per il monitoraggio continuo della resilienza dei tuoi carichi di lavoro.