Vorbereitung auf Vorfälle im Incident Manager

Die Planung eines Vorfalls beginnt lange vor dem Incident-Lebenszyklus. Wie die folgende Abbildung zeigt, bereiten Sie sich darauf vor, auf Vorfälle zu reagieren, indem Sie Chat-Kanäle einrichten, Eskalationspläne erstellen, Kontakte angeben und die Automatisierungs-Runbooks für die Reaktion auf Vorfälle festlegen. Verwenden Sie dann einen Reaktionsplan, der festlegt, wie die Überwachung erfolgt und ob die Reaktionen automatisiert werden. Nach Abschluss der Behebung können Sie den Vorfall und die Reaktion auf den Vorfall analysieren, um Ihren Reaktionsplan für future Vorfälle weiter zu verfeinern.

Ein Incident Manager-Workflow, mit dem Sie sich auf Vorfälle vorbereiten, darauf reagieren und daraus lernen können.

Themen

Überwachen

Die Überwachung des Zustands Ihrer AWS gehosteten Anwendungen ist entscheidend, um die Verfügbarkeit und Leistung Ihrer Anwendungen sicherzustellen. Beachten Sie bei der Auswahl von Überwachungslösungen Folgendes:

Kritikalität der Funktion — Wenn das System ausfallen sollte, wie gravierend wären die Auswirkungen auf nachgeschaltete Anwender?
Gemeinsamkeit von Ausfällen — Wie häufig fällt ein System aus? Systeme, bei denen häufig eingegriffen werden muss, sollten engmaschig überwacht werden.
Höhere Latenz — Um wie viel Zeit bis zur Erledigung einer Aufgabe benötigt wird.
Clientseitige und serverseitige Metriken — Wenn es eine Diskrepanz zwischen verwandten Metriken auf dem Client und dem Server gibt.
Fehler bei Abhängigkeiten — Fehler, auf die sich Ihr Team vorbereiten kann und sollte.

Nachdem Sie Reaktionspläne erstellt haben, können Sie mithilfe Ihrer Überwachungslösungen Vorfälle automatisch verfolgen, sobald sie in Ihrer Umgebung auftreten. Weitere Informationen zur Nachverfolgung und Erstellung von Vorfällen finden Sie unterVorfalldetails in der Incident Manager-Konsole anzeigen.

Weitere Informationen zur Architektur sicherer, leistungsstarker, robuster und effizienter Infrastrukturanwendungen und Workloads finden Sie unter Well-Architected.AWS

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Verwaltung von Vorfällen in verschiedenen AWS-Konten Regionen

Konfiguration von Replikationssätzen und Ergebnissen