Application Signals を使用したアプリケーションの運用状態のモニタリング - Amazon CloudWatch

Application Signals を使用したアプリケーションの運用状態のモニタリング

CloudWatch コンソール内で Application Signals を使用すると、アプリケーションの運用状態のモニタリングとトラブルシューティングを行うことができます。

  • アプリケーションサービスのモニタリング — 日常の運用状態のモニタリングの一環として、[サービス] ページを使用すると、すべてのサービスの概要を確認できます。障害率またはレイテンシーが最も高いサービスを確認したり、どのサービスのサービスレベル指標 (SLI) が正常でないかを確認したりできます。サービスを選択して [サービスの詳細] ページを開くと、詳細なメトリクス、サービスオペレーション、Synthetics Canary、およびクライアントリクエストを確認できます。これは、運用上の問題のトラブルシューティングと根本原因の特定に役立ちます。

  • アプリケーションのトポロジの検査[サービスマップ] を使用すると、クライアント、Synthetics Canary、サービス、依存関係の間の関係を含むアプリケーションのトポロジを経時的に把握し、モニタリングすることができます。サービスレベル指標 (SLI) の状態を瞬時に確認したり、コール量、障害率、レイテンシーなどの主要な指標を確認したりできます。ドリルダウンすると、[サービスの詳細] ページで詳細情報を確認できます。

これらのページを使用することで、最初の問題検出から根本原因の特定に至るまでの運用サービスの状態の問題を迅速にトラブルシューティングできるシナリオの例をご覧ください。

Application Signals によって運用状態のモニタリングが可能になる仕組み

Application Signals でアプリケーションを有効にすると、アプリケーションサービス、API、およびそれらの依存関係が自動的に検出され、[サービス] ページ、[サービスの詳細] ページ、および [サービスマップ] ページに表示されます。Application Signals によって複数のソースから情報が収集されるので、サービスを検出したり、運用状態をモニタリングしたりできます。

  • AWS Distro for OpenTelemetry (ADOT) — Application Signals を有効にすると、OpenTelemetry Java および Python 自動インストルメンテーションライブラリは、CloudWatch エージェントによって収集されたメトリクスとトレースを出力するように設定されます。これらのメトリクスとトレースは、サービス、運用、依存関係、その他のサービス情報を検出するために使用されます。

  • サービスレベル目標 (SLO) — サービスのサービスレベル目標を作成すると、[サービス] ページ、[サービスの詳細] ページ、[サービスマップ] ページにサービスレベル指標 (SLI) の状態が表示されます。SLI により、レイテンシー、可用性、その他の運用メトリクスをモニタリングできます。

  • CloudWatch Synthetics Canary — Canary に X-Ray トレースを設定すると、Canary スクリプトからのサービスへの呼び出しがサービスに関連付けられ、[サービスの詳細] ページに表示されます。

  • CloudWatch リアルユーザーモニタリング (RUM) — CloudWatch RUM ウェブクライアントで X-Ray トレースが有効になっている場合、サービスへのリクエストが自動的に関連付けられ、[サービスの詳細] ページに表示されます。

  • AWS Service Catalog AppRegistry — Application Signals は、アカウント内の AWS リソースを自動検出し、これらのリソースを AppRegistry で作成された論理アプリケーションにグループ化できるようにします。[サービス] ページに表示されるアプリケーション名は、サービスが実行されている基盤のコンピュートリソースに基づいています。

注記

Application Signals は、ユーザーが選択した現在の時間フィルター内に出力されたメトリックとトレースに基づいて、サービスと運用を表示します。(デフォルトでは過去 3 時間です。) 現在の時間フィルター内にサービス、運用、依存関係、Synthetics Canary、またはクライアントページにアクティビティが発生しなかった場合は表示されません。

現時点では、最大 1,000 個のサービスを表示できます。サービスとサービストポロジの検出は最大で 10 分遅れることがあります。サービスレベル指標 (SLI) の状態の評価は最大で 15 分遅れることがあります。