PERF04-BP03 データベースのパフォーマンスメトリクスを収集して記録する - AWS Well-Architected Framework

PERF04-BP03 データベースのパフォーマンスメトリクスを収集して記録する

データ管理システムのパフォーマンスを把握するには、関連性のあるメトリクスを追跡することが重要です。このようなメトリクスは、データ管理リソースを最適化し、ワークロード要件が満たされていることを確かめ、ワークロードのパフォーマンスの概要を明確に把握するのに役立ちます。データベースのパフォーマンスに関連するパフォーマンスの測定値を記録するツール、ライブラリ、システムを使用します。

メトリクスには、データベースがホストされているシステムに関連するメトリクス (CPU、ストレージ、メモリ、IOPS など) と、データ自体にアクセスするためのメトリクス (1 秒あたりのトランザクション数、クエリレート、応答時間、エラーなど) があります。これらのメトリクスは、すべてのサポートスタッフまたは運用スタッフが簡単にアクセスできる必要があります。また、傾向、異常、ボトルネックを特定できる十分な過去の記録が必要です。

期待される成果: データベースのワークロードのパフォーマンスをモニタリングするには、一定期間にわたって複数のパフォーマンスメトリクスを記録する必要があります。これにより、異常を検出し、ビジネスメトリクスに照らしてパフォーマンスを測定して、ワークロードのニーズを確実に満たすことができます。

一般的なアンチパターン:

  • メトリクスの検索に手動ログファイルのみを使用している。

  • チームが使用する内部ツールにのみメトリクスを発行しており、ワークロードの全体像を把握できていない。

  • 一部のモニタリングソフトウェアで記録されるデフォルトのメトリクスのみを使用している。

  • 問題が発生したときにだけメトリクスを確認している。

  • システムレベルのメトリクスのみをモニタリングし、データアクセスや使用状況に関するメトリクスを把握していない。

このベストプラクティスを活用するメリット: パフォーマンスのベースラインを確立すると、ワークロードの通常の動作とワークロードの要件を理解するのに役立ちます。異常なパターンをより迅速に特定してデバッグできるため、データベースのパフォーマンスと信頼性が向上します。データベースのキャパシティは、パフォーマンスを犠牲にすることなくコストを最適化するように設定できます。

このベストプラクティスを活用しない場合のリスクレベル:

  • 異常なパフォーマンスレベルと通常のパフォーマンスレベルを区別できなければ、問題の特定とそれに伴う意思決定が困難になる。

  • 実現可能なコスト削減が特定できない可能性がある。

  • 成長パターンが特定されないため、信頼性やパフォーマンスの低下につながる可能性がある。

実装のガイダンス

データベースグ関連のメトリクスを特定、収集、集計し、関連付けを行います。メトリクスは、データベースをサポートする基盤となるシステムとデータベース自体の両方のメトリクスが含まれている必要があります。基盤となるシステムのメトリクスには、CPU 使用率、メモリ、使用可能なディスク容量、ディスク I/O、ネットワークのインバウンドとアウトバウンドに関するメトリクスなどがあり、データベースのメトリクスには 1 秒あたりのトランザクション数、上位のクエリ、平均クエリレート、応答時間、インデックス使用率、テーブルロック、クエリのタイムアウトの数、開いている接続の数などがあります。このデータは、ワークロードのパフォーマンスやデータベースソリューションの使用状況を理解するために不可欠です。これらのメトリクスをデータ駆動型アプローチの一部として使用し、ワークロードのリソースを調整および最適化します。 

実装手順:

  1. 追跡するべき重要なデータベースメトリクスはどれですか。

  2. 運用上の異常なパフォーマンスの問題を検出する機械学習ソリューションは、データベースのモニタリングに役立ちますか。

    1. Amazon DevOps Guru for Amazon RDS は、パフォーマンス上の問題を可視化し、是正措置についての推奨事項を提供します。

  3. SQL の使用状況についてアプリケーションレベルの詳細が必要ですか。

    1. AWS X-Ray をアプリケーションに組み込むと、洞察を得て、単一のクエリのすべてのデータポイントをカプセル化できます。

  4. 現在、承認済みのロギングおよび監視ソリューションがありますか。

    1. Amazon CloudWatch では、アーキテクチャ内のリソース全体のメトリクスを収集できます。また、カスタムメトリクスを収集および発行して、ビジネスメトリクスまたは導出メトリクスを表面化することも可能です。CloudWatch またはサードパーティーのソリューションを使用して、しきい値を超過したことを示すアラームを設定します。

  5. セキュリティおよび運用の目標に合ったデータ保持ポリシーを特定、構成しましたか。

実装計画に必要な工数レベル: すべてのデータベースリソースからのメトリクスを特定、追跡、収集、集約し、関連付けるには、  程度の労力が必要です。

リソース

関連ドキュメント:

関連動画:

関連サンプル: