PERF02-BP03 コンピューティング関連のメトリクスを収集する - AWS Well-Architected Framework

PERF02-BP03 コンピューティング関連のメトリクスを収集する

コンピューティングリソースのパフォーマンスを理解するには、各種システムの実際の使用率を記録して追跡する必要があります。このデータは、リソース要件についてより正確な判断を行うために使用できます。 

ワークロードでは、メトリクス、ログ、イベントなどのデータが大量に生成される可能性があります。既存のストレージ、モニタリング、可観測性のサービスが、生成されたデータを管理できるかどうかを判断してください。どのメトリクスがリソースの使用率を反映し、単一のプラットフォーム全体で収集、集計、相関できるかを特定します。このメトリクスは、システム全体を容易に可視化し、パフォーマンス改善の機会と問題を迅速に特定できるよう、すべてのワークロードリソース、アプリケーション、サービスを表している必要があります。

期待される成果: コンピューティング関連のリソースに関係するすべてのメトリクスが、単一のプラットフォーム上で特定、収集、集約されて関連付けが行われ、コストと運用の目標をサポートするために保持が実装されます。

一般的なアンチパターン:

  • メトリクスの検索に手動ログファイルのみを使用している。 

  • 内部ツールにのみメトリクスを発行している。

  • 一部のモニタリングソフトウェアで記録されるデフォルトのメトリクスのみを使用している。

  • 問題が発生したときにだけメトリクスを確認している。

このベストプラクティスを活用するメリット: ワークロードのパフォーマンスをモニタリングするには、一定期間にわたって複数のパフォーマンスメトリクスを記録する必要があります。これらのメトリクスにより、パフォーマンスの異常を検出できます。また、ビジネスメトリクスに照らし合わせてパフォーマンスを測定することで、ワークロードのニーズを満たしているかどうかを確認できます。

このベストプラクティスを活用しない場合のリスクレベル:

実装のガイダンス

コンピューティング関連のメトリクスを特定、収集、集計し、関連付けを行います。Amazon CloudWatch などのサービスを使用すると、実装をより迅速かつ簡単に維持できます。デフォルトで記録されるメトリクスに加えて、ワークロード内のシステムレベルのメトリクスを追加で特定し、追跡します。CPU 使用率、メモリ、ディスク I/O、ネットワークのインバウンドおよびアウトバウンドメトリクスなどのデータを記録し、使用状況レベルやボトルネックを把握します。このデータは、ワークロードのパフォーマンスやコンピューティングソリューションの使用状況を理解するために不可欠です。これらのメトリクスをデータ駆動型のアプローチの一部として使用し、ワークロードのリソースを積極的に調整および最適化します。 

実装手順:

  1. 追跡するのが重要なコンピューティングソリューションメトリクスはどれですか。

  2. 現在、承認済みのロギングおよび監視ソリューションを使用していますか。

  3. セキュリティおよび運用の目標に合ったデータ保持ポリシーを特定、構成しましたか。

  4. メトリクスおよびログの集計エージェントをどのようにデプロイしますか。

実装計画に必要な工数レベル: すべてのコンピューティングリソースからのメトリクスを特定、追跡、収集、集約し、関連付けるには、  程度の労力が必要です。

リソース

関連ドキュメント:

関連動画:

関連サンプル: