OPS10-BP04 Definieren von Eskalationspfaden - AWS Well-Architected Framework

OPS10-BP04 Definieren von Eskalationspfaden

Legen Sie in Ihren Protokollen zur Vorfallreaktion klare Eskalationspfade fest, um rechtzeitige und effektive Maßnahmen zu ermöglichen. Dazu gehören die Festlegung von Aufforderungen zur Eskalation, die detaillierte Beschreibung des Eskalationsprozesses und die vorherige Genehmigung von Maßnahmen, um die Entscheidungsfindung zu beschleunigen und die durchschnittliche Zeit für die Behebung zu verkürzen.

Gewünschtes Ergebnis: Ein strukturierter und effizienter Prozess, der Vorfälle an das entsprechende Personal weiterleitet und so die Reaktionszeiten und Auswirkungen minimiert.

Typische Anti-Muster:

  • Mangelnde Klarheit über die Wiederherstellungsverfahren führt zu provisorischen Maßnahmen bei kritischen Vorfällen.

  • Das Fehlen von definierten Berechtigungen und Zuständigkeiten führt zu Verzögerungen, wenn dringende Maßnahmen erforderlich sind.

  • Stakeholder und Kunden werden nicht erwartungsgemäß informiert.

  • Wichtige Entscheidungen verzögern sich.

Vorteile der Nutzung dieser bewährten Methode:

  • Optimierte Reaktion auf Vorfälle durch vordefinierte Eskalationsverfahren.

  • Reduzierte Ausfallzeiten durch vorab genehmigte Maßnahmen und klare Zuständigkeiten.

  • Verbesserte Ressourcenzuweisung und Anpassung der Support-Ebene an den Schweregrad des Vorfalls.

  • Verbesserte Kommunikation mit Stakeholdern und Kunden.

Risikostufe bei fehlender Befolgung dieser bewährten Methode: Mittel

Implementierungsleitfaden

Richtig definierte Eskalationspfade sind entscheidend für eine schnelle Reaktion auf Vorfälle. AWS Systems Manager Incident Manager unterstützt die Einrichtung strukturierter Eskalations- und Bereitschaftspläne, die die richtigen Mitarbeiter alarmieren, damit sie bei Vorfällen handlungsbereit sind.

Implementierungsschritte

  1. Einrichtung von Eskalationsaufforderungen: Richten Sie CloudWatch-Alarme ein, um einen Vorfall in AWS Systems Manager Incident Manager zu erstellen.

  2. Erstellen von Bereitschaftsplänen: Erstellen Sie Bereitschaftspläne in Incident Manager, die auf Ihre Eskalationspfade abgestimmt sind. Statten Sie das Bereitschaftspersonal mit den erforderlichen Berechtigungen und Tools aus, um schnell handeln zu können.

  3. Detaillierte Eskalationsverfahren:

    • Legen Sie bestimmte Bedingungen fest, unter denen ein Vorfall eskaliert werden sollte.

    • Erstellen Sie Eskalationspläne in Incident Manager.

    • Eskalationskanäle sollten aus einem Ansprechpartner oder einem Bereitschaftsplan bestehen.

    • Definieren Sie die Rollen und Verantwortlichkeiten des Teams auf jeder Eskalationsstufe.

  4. Genehmigung von Schadensbegrenzungsmaßnahmen im Voraus: Arbeiten Sie mit Entscheidungsträgern zusammen, um Maßnahmen für erwartete Szenarien vorab zu genehmigen. Verwenden Sie die in Incident Manager integrierten Systems-Manager-Automation-Runbooks, um die Behebung von Vorfällen zu beschleunigen.

  5. Angabe der Zuständigkeit: Identifizieren Sie eindeutig die internen Besitzer für jeden Schritt des Eskalationspfads.

  6. Details zu Eskalationen mit Drittanbietern:

    • Dokumentieren Sie Service Level Agreements (SLAs) von Drittanbietern und richten Sie sie an internen Zielen aus.

    • Legen Sie klare Protokolle für die Lieferantenkommunikation bei Vorfällen fest.

    • Integrieren Sie Lieferantenkontakte in die Tools zum Vorfallmanagement, um direkten Zugriff zu erhalten.

    • Führen Sie regelmäßige Übungen durch, die Reaktionsszenarien von Drittanbietern beinhalten.

    • Sorgen Sie dafür, dass die Informationen zur Lieferanteneskalation gut dokumentiert und leicht zugänglich sind.

  7. Trainieren und Testen von Eskalationsplänen: Schulen Sie Ihr Team im Eskalationsprozess und führen Sie regelmäßig Übungen zur Reaktion auf Vorfälle oder den Ernstfall durch. Kunden mit Enterprise Support können einen Workshop zum Vorfallmanagement anfordern.

  8. Weitere Verbesserung: Überprüfen Sie regelmäßig die Wirksamkeit Ihrer Eskalationspfade. Aktualisieren Sie Ihre Prozesse auf Grundlage der Erkenntnisse aus den Nachuntersuchungen von Vorfällen und dem kontinuierlichen Feedback.

Aufwand für den Implementierungsplan: Mittel

Ressourcen

Zugehörige bewährte Methoden:

Zugehörige Dokumente: