AWS Direct Connect リソースのモニタリング - AWS Direct Connect

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Direct Connect リソースのモニタリング

モニタリングは、Direct Connect リソースの信頼性、可用性、パフォーマンスを維持する上で重要な部分です。マルチポイント障害が発生した場合は、その障害をより簡単にデバッグできるように、 AWS ソリューションのすべての部分からモニタリングデータを収集する必要があります。ただし、Direct Connect のモニタリングを開始する前に、以下の質問に対する回答を反映したモニタリング計画を作成する必要があります。

  • どのような目的でモニタリングしますか?

  • どのようなリソースをモニタリングする必要がありますか?

  • これらのリソースをモニタリングする頻度は?

  • 使用できるモニタリングツールは?

  • 誰がモニタリングタスクを実行しますか?

  • 問題が発生したときに誰が通知を受け取りますか?

次のステップでは、さまざまなタイミングと負荷条件でパフォーマンスを測定することにより、お客様の環境で通常の Direct Connect パフォーマンスのベースラインを確定します。Direct Connect をモニタリングする際、過去のモニタリングデータを保存することができます。保存すれば、パフォーマンスデータをこの過去のデータと比較して、通常のパフォーマンスパターンとパフォーマンス異常を識別することで、問題の対処方法を考案しやすくなります。

ベースラインを確定するには、物理的な Direct Connect 接続の使用状況、状態、正常性をモニタリングする必要があります。

モニタリングツール

AWS には、 AWS Direct Connect 接続のモニタリングに使用できるさまざまなツールが用意されています。これらのツールの一部はモニタリングを行うように設定できますが、一部のツールは手動による介入が必要です。モニタリングタスクをできるだけ自動化することをお勧めします。

自動モニタリングツール

以下の自動化されたモニタリングツールを使用して、Direct Connect を監視し、問題が発生したときにレポートできます。

  • Amazon CloudWatch アラーム – 指定した期間にわたって 1 つのメトリクスを確認できます。このアラームは、複数の期間にわたる一定のしきい値とメトリクスの値の関係性に基づき、1 つ以上のアクションを実行します。アクションは、Amazon SNS トピックに送信される通知です。CloudWatch のアラームは、メトリクスが特定の状態になっただけではアクションを呼び出しません。アクションを呼び出すには、状態が変化して、指定した期間継続している必要があります。利用可能なメトリクスとディメンションの詳細については、Amazon CloudWatch で を監視する を参照してください。

  • AWS CloudTrail ログモニタリング – アカウント間でログファイルを共有し、CloudWatch Logs に送信して CloudWatch CloudTrail ログファイルをリアルタイムでモニタリングします。ログ処理アプリケーションを Java で記述し、CloudTrail で配信後にログファイルが変更されていないことを検証することもできます。詳細については、「API コールをログする」と、AWS CloudTrail ユーザーガイドの「CloudTrail ログファイルの操作」を参照してください。

手動モニタリングツール

AWS Direct Connect 接続をモニタリングするもう 1 つの重要な点は、CloudWatch アラームでカバーされていない項目を手動でモニタリングすることです。Direct Connect および CloudWatch のコンソールダッシュボードには、 AWS 環境の状態が一目でわかるビューが表示されます。

  • AWS Direct Connect コンソールには以下が表示されます。

    • 接続のステータス ([State] 列を参照)

    • 仮想インターフェイスのステータス ([State] 列を参照)

  • CloudWatch のホームページには、以下の情報が表示されます。

    • 現在のアラームとステータス

    • アラームとリソースのグラフ

    • サービスのヘルスステータス

    また、CloudWatch を使用して以下のことを行えます。

    • 重要なサービスをモニタリングするためにカスタマイズされたダッシュボードを作成する。

    • メトリクスデータをグラフ化して、問題のトラブルシューティングを行い、傾向を確認する。

    • すべての AWS リソースメトリクスを検索して参照します。

    • 問題があることを通知するアラームを作成および編集する。