OPS09-BP02 運用メトリクスを定義する
運用メトリクスを定義して、KPI の達成度 (デプロイの成功、失敗したデプロイなど) を測定します。運用アクティビティの正常性を測定する運用メトリクスを定義します (たとえば、インシデントを検出する平均時間 (MTTD)、インシデントからの平均復旧時間 (MTTR) など)。メトリクスを評価して、運用アクティビティが必要な成果に達しているかを判定し、運用の正常性を把握します。
一般的なアンチパターン:
-
運用メトリクスは、チームが合理的であると考える内容に基づいています。
-
メトリクスの計算にエラーがあり、誤った結果が生成されます。
-
あなたは、運用アクティビティに対して定義されたメトリクスを備えていません。
このベストプラクティスを活用するメリット: 運用メトリクスを定義して評価することで、運用アクティビティの状態を判断し、ビジネス成果の達成を測定できます。
このベストプラクティスを活用しない場合のリスクレベル: 高
実装のガイダンス
-
運用メトリクスを定義する: KPI の達成度を測定するため、運用メトリクスを定義します。運用メトリクスを定義して、運用とそのアクティビティの正常性を測定します。メトリクスを評価して、オペレーションが必要な成果に達しているかを判定し、オペレーションの正常性を把握します。
リソース
関連するドキュメント:
関連動画:
-
モニタリング計画を立てる