翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
付録 C ‒ インシデント分類
分類フレームワーク内のインシデントを追跡することは重要です。フレームワークは、システムに影響を与える障害タイプと問題の全体像を提供するためです。組織がインフラストラクチャの障害など、インシデントを 1 つのクラス内でのみ追跡する場合、インサイトを見逃したり、他の分野を改善したりする可能性があります。複数のクラスにわたるインシデントを追跡することで、実行するさまざまなカオス実験をよりよく理解できます。この視点は潜在的な死角を特定し、エンジニアリング範囲の拡大をサポートし、より回復力があり耐障害性のあるシステムにつながります。
推奨されるインシデント分類フレームワークは、インシデントの性質と潜在的な影響に基づいてインシデントを分類するのに役立つように設計されています。インシデントを 8 つの主要なカテゴリにグループ化する高レベルの分類を使用します。
-
デプロイの問題:
-
失敗したデプロイ
-
ロールバックの失敗
-
デプロイ中の設定の問題
-
-
ソフトウェアのバグとリグレッション:
-
機能バグ
-
統合の問題
-
パフォーマンスの問題
-
クォータの問題
-
障害耐性メカニズムの問題 (再試行、タイムアウト)
-
データ整合性の問題
-
-
テストの問題:
-
欠落しているテスト
-
無効なテスト
-
フレアテスト
-
-
インフラストラクチャの障害:
-
ハードウェア障害 (サーバー、ネットワークデバイス、ストレージ)
-
スケーリングの問題
-
依存関係の障害 (サードパーティーのサービス、APIs)
-
ネットワーク接続の問題
-
-
運用上の問題:
-
ヒューマンエラー (設定ミス、偶発的な変更)
-
障害のモニタリングとアラート
-
キャパシティプランニングの問題
-
バックアップと復元の失敗
-
-
セキュリティインシデント:
-
許可されていないアクセスの試行
-
データ侵害
-
サービス拒否 (DoS) 攻撃
-
-
サードパーティーサービスの停止:
-
クラウドプロバイダーの停止
-
DNS 障害
-
外部 API とサービスの中断
-
-
環境要因:
-
自然災害 (地震、火災、洪水、停電)
-
気象関連の問題
-
これは、特定のニーズや組織に合わせて調整できる非決定的な分類フレームワークの例です。システムの進化や新しいタイプのインシデントの発生に応じて、分類フレームワークを定期的に確認および更新することをお勧めします。