AWS Direct Connect リソースのモニタリング - AWS Direct Connect

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Direct Connect リソースのモニタリング

モニタリングは、Direct Connect リソースの信頼性、可用性、パフォーマンスを維持する上で重要な部分です。マルチポイント障害が発生した場合は、その障害をより簡単にデバッグできるように、 AWS ソリューションのすべての部分からモニタリングデータを収集する必要があります。ただし、Direct Connect のモニタリングを開始する前に、以下の質問に対する回答を含むモニタリング計画を作成する必要があります。

  • どのような目的でモニタリングしますか?

  • どのようなリソースをモニタリングする必要がありますか?

  • これらのリソースをモニタリングする頻度は?

  • 使用できるモニタリングツールは?

  • 誰がモニタリングタスクを実行しますか?

  • 問題が発生したときに誰が通知を受け取りますか?

次のステップでは、さまざまなタイミングと負荷条件でパフォーマンスを測定することで、環境で通常の Direct Connect パフォーマンスのベースラインを確立します。Direct Connect をモニタリングするときは、過去のモニタリングデータを保存します。保存すれば、パフォーマンスデータをこの過去のデータと比較して、通常のパフォーマンスパターンとパフォーマンス異常を識別することで、問題の対処方法を考案しやすくなります。

ベースラインを確立するには、物理的な Direct Connect 接続の使用状況、状態、および正常性をモニタリングする必要があります。

モニタリングツール

AWS には、 AWS Direct Connect 接続のモニタリングに使用できるさまざまなツールが用意されています。これらのツールの一部はモニタリングを行うように設定できますが、一部のツールは手動による介入が必要です。モニタリングタスクをできるだけ自動化することをお勧めします。

自動モニタリングツール

次の自動モニタリングツールを使用して Direct Connect を監視し、問題が発生したときに報告できます。

  • Amazon CloudWatch アラーム – 指定した期間にわたって 1 つのメトリクスを監視します。このアラームは、複数の期間にわたる一定のしきい値とメトリクスの値の関係性に基づき、1 つ以上のアクションを実行します。アクションは、Amazon SNS topic. CloudWatch alarms に送信される通知です。アクションは、単に特定の状態にあるというだけでは呼び出されません。状態が変更され、指定された期間維持されている必要があります。利用可能なメトリクスとディメンションの詳細については、Amazon によるモニタリング CloudWatch を参照してください。

  • AWS CloudTrail ログのモニタリング – アカウント間でログファイルを共有し、 CloudTrail ログファイルを CloudWatch Logs に送信してリアルタイムでモニタリングします。Java でログ処理アプリケーションを記述し、 による配信後にログファイルが変更されていないことを検証することもできます CloudTrail。詳細については、「 ユーザーガイド」のログAPI呼び出し「」および「ログファイルの使用AWS CloudTrail 」を参照してください。 CloudTrail

手動モニタリングツール

AWS Direct Connect 接続のモニタリングでもう 1 つ重要な点は、 CloudWatch アラームでカバーされない項目を手動でモニタリングすることです。Direct Connect と CloudWatchコンソールのダッシュボードには、環境の状態 at-a-glance AWS が表示されます。

  • AWS Direct Connect コンソールには以下が表示されます。

    • 接続のステータス ([State] 列を参照)

    • 仮想インターフェイスのステータス ([State] 列を参照)

  • CloudWatch ホームページには以下が表示されます。

    • 現在のアラームとステータス

    • アラームとリソースのグラフ

    • サービスのヘルスステータス

    さらに、 CloudWatch を使用して次の操作を実行できます。

    • 重要なサービスをモニタリングするためにカスタマイズされたダッシュボードを作成する。

    • メトリクスデータをグラフ化して、問題のトラブルシューティングを行い、傾向を確認する。

    • すべての AWS リソースメトリクスを検索して参照します。

    • 問題があることを通知するアラームを作成および編集する。