OPS09-BP03 運用メトリクスを収集し、分析する - AWS Well-Architected Framework

OPS09-BP03 運用メトリクスを収集し、分析する

メトリクスのプロアクティブなレビューを定期的に行うと、傾向を把握し、適切な対応が必要な領域を特定できます。

運用アクティビティと運用 API コールの実行から、CloudWatch Logs などのサービスにログデータを集約する必要があります。必要なログコンテンツの観測からメトリクスを生成して、運用アクティビティのパフォーマンスのインサイトを得られるようにします。

AWS では、 ログデータを Amazon S3 に エクスポートしたり、 ログAmazon S3 に直接送信して、 長期保存したりできます。分析のために、 AWS Glueを使用すると、Amazon S3 でログデータを検出して準備し、関連するメタデータを AWSAWS Glue Data Catalog に保存できますAmazon Athena では、AWS Glue とのネイティブな統合により、ログデータを分析し、標準 SQL を使用してクエリを実行できます。Amazon QuickSight などのビジネスインテリジェンスツール を使用して、 データを可視化、調査、分析することができます。

一般的なアンチパターン:

  • 新機能の継続的な提供は、主要業績評価指標とみなされます。あなたは、デプロイの発生頻度を測定する方法を備えていません。

  • あなたは、デプロイ、ロールバックされたデプロイ、パッチ、およびロールバックされたパッチをログに記録して、運用アクティビティを追跡しますが、メトリクスを確認する人はいません。

  • あなたは、システムがデプロイされ、ユーザーがいないときに、15 分間の復旧時間以内に失われたデーベースを復旧することを目標として課せられました。このシステムは 2 年間運用されており、現在 10,000 人のユーザーがいます。最近の復旧には 2 時間以上かかりました。これは記録されておらず、誰も認識していません。

このベストプラクティスを活用するメリット: 運用メトリクスを収集して分析することで、運用の状態を把握し、運用やビジネス成果の達成に影響を与える可能性のある傾向について洞察を得ることができます。

このベストプラクティスを活用しない場合のリスクレベル:

実装のガイダンス

リソース

関連するドキュメント: