OPS08-BP02 ワークロードログを分析する - AWS Well-Architected Framework

OPS08-BP02 ワークロードログを分析する

アプリケーションの運用面をより詳細に把握するには、ワークロードログを定期的に分析することが不可欠です。ログデータを効率的にふるい分け、可視化し、解釈することで、アプリケーションのパフォーマンスとセキュリティを継続的に最適化できます。

期待される成果: 詳細なログ分析から得られるアプリケーションの動作と運用に関する豊富なインサイトを利用することで、積極的な問題の検出と軽減が実現します。

一般的なアンチパターン:

  • 重大な問題が発生するまでログの分析を怠っている。

  • ログ分析に利用できるツールをフルセットで使用していないため、重要なインサイトを見逃してしまう。

  • 自動化やクエリ機能を活用せずに、ログの手動確認のみに依存している。

このベストプラクティスを活用するメリット:

  • 運用上のボトルネック、セキュリティ上の脅威、その他の潜在的な問題を事前に特定できます。

  • ログデータを効率的に利用して、アプリケーションを継続的に最適化できます。

  • アプリケーションの動作に関してより詳細に把握できるようになり、デバッグとトラブルシューティングに役立ちます。

このベストプラクティスが確立されていない場合のリスクレベル:

実装のガイダンス

Amazon CloudWatch Logs はログ分析のための強力なツールです。CloudWatch Logs Insights や Contributor Insights などの統合された機能を使用して、ログから意義ある情報を導き出すプロセスが直感的かつ効率的になります。

実装手順

  1. CloudWatch Logs の設定: ログを CloudWatch Logs に送信するようにアプリケーションとサービスを設定します。

  2. ログ異常検出の使用: Amazon CloudWatch Logs 異常検出を使用して、異常なログパターンを自動的に識別して警告します。このツールを使用すると、ログの異常を積極的に管理し、潜在的な問題を早期に検出できます。

  3. CloudWatch Logs Insights の設定: CloudWatch Logs Insights を使用して、ログデータのインタラクティブ検索と分析を行います。

    1. クエリを作成してパターンを抽出し、ログデータを可視化して、実践的なインサイトを導き出します。

    2. CloudWatch Logs Insights のパターン分析を使用して、頻繁に発生するログパターンを分析および視覚化します。この機能は、ログデータの一般的な運用傾向と潜在的な外れ値を理解するのに役立ちます。

    3. CloudWatch Logs 差分を使用して、異なる期間または異なるロググループの間の差分分析を実行します。この機能を使用すると、変更点を特定し、システムのパフォーマンスや動作への影響を評価できます。

  4. Live Tail を使用したリアルタイムのログモニタリング: Amazon CloudWatch Logs Live Tail を使用して、ログデータをリアルタイムで表示します。アプリケーションの運用アクティビティを発生時に積極的にモニタリングできるため、システムパフォーマンスと潜在的な問題を即座に把握できます。

  5. Contributor Insights の活用: CloudWatch Contributor Insights を活用して、IP アドレスやユーザーエージェントなどの高カーディナリティディメンションでトップのトーカーを特定します。

  6. CloudWatch Logs メトリクスフィルターの実装: CloudWatch Logs メトリクスフィルターを設定して、ログデータを実用的なメトリクスに変換します。これにより、アラームを設定したり、パターンをさらに詳細に分析したりできます。

  7. CloudWatch クロスアカウントオブザーバビリティの実装: リージョン内の複数のアカウントにわたるアプリケーションのモニタリングとトラブルシューティングを行います。

  8. 定期的なレビューと調整: ログ分析戦略を定期的に確認して、すべての関連情報を収集し、アプリケーションのパフォーマンスを継続的に最適化します。

実装計画に必要な工数レベル:

リソース

関連するベストプラクティス:

関連するドキュメント:

関連動画:

関連する例: