可観測性 - AWS での 5G ネットワークの継続的インテグレーションと継続的デリバリー

可観測性

AWS では、AWS にデフォルトでデプロイされている 5G CNF の可観測性が有効になります。これは Amazon CloudWatch によって実現されている機能です。CloudWatch によりは、クラウドリソースとアプリケーションの完全な可視化が可能になります。

このプロセスで、Amazon CloudWatch の処理には次の 4 つの主要なステップがあります。

  1. 収集 — AWS とオンプレミスのサーバーで実行されるすべての AWS リソース、アプリケーション、サービスから、メトリクスとログを収集します。

  2. 監視 — CloudWatch ダッシュボードでアプリケーションとインフラストラクチャを視覚化し、トラブルシューティング用にログとメトリクスを並べて関連を示し、CloudWatch Alarms でアラートを設定します。

  3. アクションCloudWatch EventsAWS Auto Scaling を使用して、運用上の変更に対する対応を自動化します。

  4. 分析CloudWatch Metric Math によるリアルタイム分析、最大 1 秒のメトリクス、データ保持期間の延長 (15 か月) が可能です。

Amazon CloudWatch エージェントが、お客様の Kubernetes クラスターにインストールされます。このエージェントは Prometheus の設定、検出、メトリクスのプル機能をサポートしており、忠実性の高いすべての Prometheus メトリクスおよびメタデータをエンリッチ化し、埋め込みメトリクスフォーマット (Embedded Metric Format: EMF) として CloudWatch Logs に公開します。

Amazon CloudWatch Container Insights は、コンテナ化されたアプリケーションからの Prometheus メトリクスの検出と収集を自動化します。ダッシュボードで視覚化され集約される CloudWatch カスタムメトリクスの収集、フィルタリング、作成が自動的に行われます。

イベントごとに、CloudWatch カスタムメトリクスとしてメトリクスデータポイントが作成され、詳細な設定によってキュレートされる一連のメトリクスディメンションに使用されます。集約された Prometheus メトリクスを CloudWatch カスタムメトリクス統計として公開すると、パフォーマンスの問題や障害のモニタリング、アラーム、トラブルシューティングに必要なメトリクスの数が減ります。また、CloudWatch Logs Insights クエリ言語を使用して忠実性の高い Prometheus メトリクスを分析し、コンテナ化された環境の正常性とパフォーマンスに影響を与える特定のポッドとラベルを分離することもできます。

AWS CloudTrail はこの可視性を提供し、サービス全体ですべての API コールを記録します。AWS Config は、コンプライアンス検証のための機能を提供します。AWS では、AWS X-RayAWS CloudTrail などのさまざまなサービスを使用して、アプリケーション、インフラストラクチャ、パイプラインのメトリクス、ログ、イベントに関する追加のモニタリングオプションをお客様に提供しています。

  • AWS では、Prometheus や Fluentd などのオープンソースのメトリクスツールをネイティブ統合で使用できます。

  • Prometheus メトリクスを、Amazon CloudWatch または OpenSearch Service に取り込み、さらに詳しく分析することもできます。

  • AWS では、さまざまなシステムからログを収集するための標準的なメカニズムとして FluentD を使用しています。このプロジェクトでも同じメカニズムが使用され、設定されています。

このメカニズムの設定方法の詳細については、「CloudWatch Logs へログを送信する DaemonSet として FluentD を設定する」を参照してください。


                Amazon CloudWatch で監視されるメトリクスを示すスクリーンショット。

Amazon CloudWatch で監視されるメトリクスの例