OPS08-BP04 Erstellen Sie umsetzbare Benachrichtigungen - Säule „Betriebliche Exzellenz“

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

OPS08-BP04 Erstellen Sie umsetzbare Benachrichtigungen

Es ist entscheidend, Abweichungen im Verhalten Ihrer Anwendung umgehend zu erkennen und darauf zu reagieren. Besonders wichtig ist es, zu erkennen, wann Ergebnisse, die auf wichtigen Leistungsindikatoren (KPIs) basieren, gefährdet sind oder wann unerwartete Anomalien auftreten. Durch die Verwendung von Warnmeldungen KPIs wird sichergestellt, dass die Signale, die Sie erhalten, in direktem Zusammenhang mit geschäftlichen oder betrieblichen Auswirkungen stehen. Der Ansatz mit umsetzbaren Warnmeldungen fördert proaktive Reaktionen und trägt zur Aufrechterhaltung der Systemleistung und Zuverlässigkeit bei.

Gewünschtes Ergebnis: Erhalten Sie zeitnahe, relevante und umsetzbare Warnmeldungen, um potenzielle Probleme schnell zu erkennen und zu beheben, insbesondere wenn die KPI Ergebnisse gefährdet sind.

Typische Anti-Muster:

  • Es werden zu viele unkritische Warnmeldungen eingerichtet, was zu einer Alarmmüdigkeit führt.

  • Keine Priorisierung von Warnmeldungen auf der Grundlage von KPIs Problemen, was es schwierig macht, die geschäftlichen Auswirkungen von Problemen zu verstehen.

  • Die eigentlichen Ursachen werden vernachlässigt, was zu wiederholten Warnmeldungen für dasselbe Problem führt.

Vorteile der Nutzung dieser bewährten Methode:

  • Geringere Alarmermüdung durch Fokussierung auf umsetzbare und relevante Warnmeldungen.

  • Verbesserte Systemverfügbarkeit und -zuverlässigkeit durch proaktive Problemerkennung und -behebung.

  • Verbesserte Teamzusammenarbeit und schnellere Problemlösung durch die Integration in übliche Alarmierungs- und Kommunikationstools.

Risikostufe bei fehlender Befolgung dieser bewährten Methode: Hoch

Implementierungsleitfaden

Um einen effektiven Warnmechanismus zu schaffen, ist es wichtig, Metriken, Protokolle und Rückverfolgungsdaten zu verwenden, die darauf hinweisen, wenn die Ergebnisse, die darauf basieren, gefährdet KPIs sind oder Anomalien entdeckt werden.

Implementierungsschritte

  1. Ermitteln Sie die wichtigsten Leistungsindikatoren (KPIs): Identifizieren Sie die Ihrer Anwendung. KPIs Warnmeldungen sollten mit diesen verknüpft werden, um die Auswirkungen KPIs auf das Unternehmen genau widerzuspiegeln.

  2. Implementierung der Erkennung von Anomalien:

    • Verwenden Sie die CloudWatch Amazon-Anomalieerkennung: Richten Sie die CloudWatch Amazon-Anomalieerkennung so ein, dass ungewöhnliche Muster automatisch erkannt werden, sodass Sie nur Warnmeldungen für echte Anomalien generieren können.

    • AWS X-Ray Nutzen Sie Insights:

      1. Richten Sie X-Ray-Insights ein, um Anomalien in Trace-Daten zu erkennen.

      2. Konfigurieren Sie Benachrichtigungen für X-Ray-Insights, um bei erkannten Problemen gewarnt zu werden.

    • Integrieren Sie mit Amazon DevOps Guru:

      1. Nutzen Sie Amazon DevOps Guru für seine maschinellen Lernfunktionen zur Erkennung betrieblicher Anomalien anhand vorhandener Daten.

      2. Navigieren Sie zu den Benachrichtigungseinstellungen in DevOps Guru, um Anomaliewarnungen einzurichten.

  3. Implementieren umsetzbarer Warnmeldungen: Entwerfen Sie Warnmeldungen, die angemessene Informationen für sofortige Maßnahmen liefern.

    1. Überwachen Sie AWS Health Ereignisse mit EventBridge Amazon-Regeln oder integrieren Sie sie programmatisch, AWS Health API um Aktionen zu automatisieren, wenn Sie AWS Health Ereignisse erhalten. Dies können allgemeine Aktionen sein, z. B. das Senden aller geplanten Lebenszyklus-Ereignisnachrichten an eine Chat-Oberfläche, oder spezifische Aktionen, wie das Initiieren eines Workflows in einem IT-Servicemanagement-Tool.

  4. Verringern der Alarmmüdigkeit: Minimieren Sie die Zahl der Warnmeldungen, die nicht kritisch sind. Wenn Teams mit zahllosen unbedeutenden Warnmeldungen überfordert werden, können sie den Überblick über kritische Probleme verlieren, was die Gesamteffektivität des Warnmechanismus beeinträchtigt.

  5. Kombinierte Alarme einrichten: Verwenden Sie CloudWatch zusammengesetzte Alarme von Amazon, um mehrere Alarme zu konsolidieren.

  6. Integration mit Alarm-Tools: Integrieren Sie Tools wie Ops Genie und PagerDuty.

  7. Engage AWS Chatbot: Integrieren Sie AWS Chatbot, um Benachrichtigungen an Amazon Chime, Microsoft Teams und Slack weiterzuleiten.

  8. Auf Protokollen basierende Warnung: Verwenden Sie Filter für Protokollmetriken CloudWatch , um Alarme auf der Grundlage bestimmter Protokollereignisse zu erstellen.

  9. Überprüfen und wiederholen: Überprüfen und verfeinern Sie die Warnkonfigurationen regelmäßig.

Aufwand für den Implementierungsplan: Mittel

Ressourcen

Zugehörige bewährte Methoden:

Zugehörige Dokumente:

Zugehörige Videos:

Zugehörige Beispiele: