Amazon を使用したロギングとモニタリングの設計と実装 CloudWatch - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon を使用したロギングとモニタリングの設計と実装 CloudWatch

Khurram Nizami、Amazon Web Services (AWS)

2023 年 4 月 (ドキュメント履歴)

このガイドは、Amazon Elastic Compute Cloud (Amazon CloudWatch EC2AWS) インスタンス、Amazon Elastic Container Service (Amazon ECS)、Amazon Elastic Kubernetes Service (Amazon EKS) 、およびオンプレミスサーバーを使用するワークロード向けに、Amazon および関連するAmazon Web Services () 管理およびガバナンスサービスを設計および実装するのに役立ちます。AWS Lambdaこのガイドは、 DevOps AWSクラウド上のワークロードを管理する運用チーム、エンジニア、アプリケーションエンジニアを対象としています

ロギングとモニタリングのアプローチは、AWS Well-Architected Framework の 6 つの柱に基づいている必要があります。これらの柱は、運用上の優秀性セキュリティ信頼性パフォーマンス効率コスト最適化 です。Well-Architected モニタリングとアラームのソリューションは、インフラストラクチャをプロアクティブに分析し調整するのに役立ち、信頼性とパフォーマンスを向上させます。

このガイドでは、セキュリティやコスト最適化のためのロギングとモニタリングについては、詳細な評価が必要なトピックであるため、広範囲には説明しません。AWSセキュリティロギングとモニタリングをサポートするサービスは、Amazon Inspector AWS CloudTrailAWS Config、Amazon Detective、Amazon MacieAmazon GuardDutyAWS Security Hubなど多数あります。またAWS Cost ExplorerAWS予算CloudWatch 請求指標を使用してコストを最適化することもできます

次の表に、ロギング、およびモニタリングソリューションが対応する 6 つの領域の概要を示します。

ログファイル、およびメトリクスの取得と取り込み システム、およびアプリケーションのログとメトリクスを識別し、構成し、さまざまなソースから AWS サービスに送信します。
ログの検索と分析 運用管理、問題の特定、トラブルシューティング、およびアプリケーション分析のためのログを検索、および分析します。
メトリクスとアラームのモニタリング ワークロードの観察と傾向を特定し、それに基づいて行動します。
アプリケーションとサービスの可用性のモニタリング サービスの可用性を継続的にモニタリングすることで、ダウンタイムを削減し、サービスレベルの目標を達成する能力を向上させます。
アプリケーションをトレースする システムと外部の依存関係にあるアプリケーションのリクエストを追跡して、パフォーマンスの微調整、根本原因の分析、および問題のトラブルシューティングを行います。
ダッシュボードとビジュアライゼーションの作成 システムおよびワークロードの関連メトリクスと観察結果に焦点を当てたダッシュボードを作成し、継続的な改善と問題の事前発見に役立てることができます。

CloudWatch は、ロギングとモニタリングのほとんどの要件を満たすことができ、信頼性、拡張性、柔軟性に優れたソリューションを提供します。多くのAWSサービスは、 CloudWatch 監視と分析のためのロギング統合に加えて、 CloudWatch メトリクスを自動的に提供します。 CloudWatch また、サーバ(クラウドとオンプレミスの両方)、コンテナ、サーバーレスコンピューティングなどの様々な計算オプションをサポートするエージェントとログドライバを提供します。このガイドでは、ロギングとモニタリングで使用される以下の AWS サービスについても説明します。

選択する AWS コンピューティングサービスは、ロギングとモニタリングのソリューションの実装と設定にも影響します。例えば、 CloudWatch Amazon EC2、Amazon ECS、Amazon EKS、Lambda では、の実装と設定が異なります。

アプリケーション、およびワークロードの所有者は、ロギングとモニタリングについて忘れてしまったり、一貫性のない構成や実装をしてしまったりすることがよくあります。つまり、ワークロードは観測性が制限された本番環境に入り、問題の特定に遅延が生じ、トラブルシューティングと解決に要する時間が長くなります。少なくとも、ロギングおよびモニタリングソリューションでは、アプリケーションログおよびメトリックのアプリケーション層に加えて、オペレーティングシステム(OS)レベルのログとメトリックのシステム層に対処する必要があります。このガイドでは、次の表で概説する 3 つのコンピューティングタイプを含む、異なるコンピューティングタイプでこれらの 2 つのレイヤーに対処するための推奨されるアプローチについて説明します。

長時間稼働するイミュータブル EC2 インスタンス 複数の AWS リージョンまたはアカウントの複数のオペレーティングシステム(OS)にまたがるシステム、およびアプリケーションのログとメトリクスです。
コンテナ Amazon ECS および Amazon EKS クラスターのシステムログとアプリケーションのログとメトリックス(さまざまな設定の例を含む)です。
サーバーレス Lambda 関数のシステムログとアプリケーションのログとメトリクス、およびカスタマイズに関する考慮事項です。

このガイドでは、 CloudWatchAWS以下の領域で関連するサービスに対応するロギングとモニタリングのソリューションを提供します。

実装例は、これらの領域にわたってこのガイド全体で使用され、また AWSSamples GitHub リポジトリから入手できます