OPS11-BP07 オペレーションメトリクスのレビューを実行する - AWS Well-Architected Framework

OPS11-BP07 オペレーションメトリクスのレビューを実行する

ビジネスのさまざまな分野のチームメンバー間でオペレーションメトリクスの遡及分析を定期的に実施します。これらのレビューに基づいて、改善の機会と取り得る一連のアクションを特定するとともに、教訓を共有します。すべての環境 (開発、テスト、本番など) で改善する機会を探します。

期待される成果:

  • ビジネスに影響するメトリクスを頻繁に確認する

  • オブザーバビリティ機能を通じて異常を検出し確認する

  • データをビジネスの成果と目標の裏付けに使用する

一般的なアンチパターン:

  • 大規模な販促活動によってメンテナンスウィンドウが中断されます。ビジネスに影響する他のイベントがある場合、標準メンテナンスウィンドウが延期される可能性があることが認識されていません。

  • 組織で古いライブラリを頻繁に使用していたため、長い時間システムが停止しました。その後、サポートされているライブラリに移行しました。組織内の他のチームは、自身がリスクにさらされているかはわかっていません。

  • 顧客の SLA の達成状況を定期的に確認していません。顧客の SLA に適合しない傾向があります。顧客の SLA に適合しない場合は、金銭的ペナルティが発生します。

このベストプラクティスを活用するメリット:

  • 運用メトリクス、イベント、インシデントを定期的に確認することで、チーム間の共通理解を維持します。

  • チームは定期的にミーティングを行い、メトリクスやインシデントを確認します。これにより、リスクに対処し、顧客の SLA を確認できます。

  • 学んだ教訓を共有することで、ビジネス成果の優先順位付けや目標とする改善のためのデータが得られます。

このベストプラクティスが確立されていない場合のリスクレベル:

実装のガイダンス

  • ビジネスのさまざまな分野のチームメンバー間で運用メトリクスの遡及分析を定期的に実施します。

  • ビジネス、開発、オペレーションチームを含むステークホルダーを参加させて、即時フィードバックと遡及分析から得られた結果を検証し、教訓を共有します。

  • それらのインサイトに基づいて、改善の機会と取り得る一連のアクションを特定します。

リソース

関連するベストプラクティス:

関連するドキュメント: