Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Anhang C ‒ Klassifizierung von Vorfällen
Die Verfolgung von Vorfällen innerhalb eines Klassifizierungsrahmens ist von entscheidender Bedeutung, da das Framework einen ganzheitlichen Überblick über die Fehlertypen und Probleme bietet, die sich auf das System auswirken. Wenn Ihr Unternehmen Vorfälle nur innerhalb einer einzigen Klasse verfolgt, z. B. Infrastrukturfehler, entgehen Ihnen möglicherweise Erkenntnisse und Verbesserungsmöglichkeiten in anderen Bereichen. Indem Sie Vorfälle über mehrere Klassen hinweg verfolgen, gewinnen Sie ein besseres Verständnis für die vielfältigen Chaosexperimente, die Sie durchführen müssen. Diese Perspektive hilft bei der Identifizierung potenzieller blinder Flecken und unterstützt die Erweiterung des technischen Umfangs, was zu einem robusteren und fehlertoleranteren System führt.
Der vorgeschlagene Rahmen zur Klassifizierung von Vorfällen soll dazu beitragen, Vorfälle anhand ihrer Art und ihrer potenziellen Auswirkungen zu kategorisieren. Es verwendet eine allgemeine Klassifizierung, bei der Vorfälle in acht Hauptkategorien eingeteilt werden:
-
Probleme bei der Bereitstellung:
-
Fehlgeschlagene Bereitstellungen
-
Rollback-Fehler
-
Konfigurationsprobleme bei der Bereitstellung
-
-
Softwarefehler und Regressionen:
-
Funktionelle Fehler
-
Probleme mit der Integration
-
Probleme mit der Leistung
-
Probleme mit der Quote
-
Probleme mit dem Resilienzmechanismus (Wiederholungsversuche, Timeouts)
-
Probleme mit der Datenintegrität
-
-
Probleme beim Testen:
-
Fehlende Tests
-
Ineffektive Tests
-
Flockige Tests
-
-
Fehler in der Infrastruktur:
-
Hardwarefehler (Server, Netzwerkgeräte, Speicher)
-
Probleme mit der Skalierung
-
Abhängigkeitsfehler (Dienste von Drittanbietern, APIs)
-
Probleme mit der Netzwerkkonnektivität
-
-
Probleme mit dem Betrieb:
-
Menschliche Fehler (Fehlkonfiguration, versehentliche Änderungen)
-
Überwachung und Alarmierung von Ausfällen
-
Probleme bei der Kapazitätsplanung
-
Fehler bei der Backup und Wiederherstellung
-
-
Sicherheitsvorfälle:
-
Unbefugte Zugriffsversuche
-
Datenschutzverletzungen
-
Denial-of-Service-Angriffe (DoS)
-
-
Ausfälle von Diensten von Drittanbietern:
-
Ausfälle von Cloud-Anbietern
-
DNS-Fehler
-
Externe API- und Dienstunterbrechungen
-
-
Umweltfaktoren:
-
Naturkatastrophen (Erdbeben, Brände, Überschwemmungen, Stromausfälle)
-
Probleme im Zusammenhang mit dem Wetter
-
Dies ist ein nicht aussagekräftiges Beispiel für einen Klassifizierungsrahmen, den Sie an Ihre spezifischen Bedürfnisse und Ihr Unternehmen anpassen können. Wir empfehlen, den Klassifizierungsrahmen regelmäßig zu überprüfen und zu aktualisieren, wenn sich Ihr System weiterentwickelt oder neue Arten von Vorfällen auftreten.