Amazon CloudWatch による NAT ゲートウェイのモニタリング - Amazon Virtual Private Cloud

Amazon CloudWatch による NAT ゲートウェイのモニタリング

CloudWatch を使用して NAT ゲートウェイを監視することで、NAT ゲートウェイから情報を収集し、リアルタイムに近い読み取り可能なメトリクスに加工することができます。この情報を使用して、NAT ゲートウェイの監視とトラブルシューティングを行うことができます。NAT ゲートウェイメトリクスデータは 1 分間隔で提供され、統計は 15 か月間記録されます。

Amazon CloudWatch の詳細については、Amazon CloudWatch ユーザーガイドを参照してください。料金の詳細については、「Amazon CloudWatch の料金」を参照してください。

NAT ゲートウェイのメトリクスおよびディメンション

NAT ゲートウェイでは、次のメトリクスを使用できます。

メトリクス 説明
ActiveConnectionCount

NAT ゲートウェイ経由の同時アクティブ TCP 接続の合計数。

値が 0 の場合は、NAT ゲートウェイ経由のアクティブな接続がないことを示します。

単位: カウント

統計: 最も有用な統計は Max です。

BytesInFromDestination

NAT ゲートウェイによって受信された送信先からのバイト数。

BytesOutToSource の値が BytesInFromDestination の値より少ない場合、NAT ゲートウェイの処理中、またはトラフィックが NAT ゲートウェイによりアクティブにブロックされている間に、データ損失が発生する可能性があります。

単位: バイト

統計: 最も有用な統計は Sum です。

BytesInFromSource

VPC 内のクライアントから NAT ゲートウェイによって受信されたバイト数。

BytesOutToDestination の値が BytesInFromSource の値よりも小さい場合、NAT ゲートウェイの処理中にデータ損失が発生する可能性があります。

単位: バイト

統計: 最も有用な統計は Sum です。

BytesOutToDestination

NAT ゲートウェイ経由で送信先に送信されたバイト数。

値が 0 より大きい場合は、NAT ゲートウェイの背後にあるクライアントからインターネットへのトラフィックがあることを示します。BytesOutToDestination の値が BytesInFromSource の値よりも小さい場合、NAT ゲートウェイの処理中にデータ損失が発生する可能性があります。

単位: バイト

統計: 最も有用な統計は Sum です。

BytesOutToSource

VPC 内の NAT ゲートウェイ経由でクライアントに送信されたバイト数。

値が 0 より大きい場合は、インターネットから NAT ゲートウェイの背後にあるクライアントへのトラフィックがあることを示します。BytesOutToSource の値が BytesInFromDestination の値より少ない場合、NAT ゲートウェイの処理中、またはトラフィックが NAT ゲートウェイによりアクティブにブロックされている間に、データ損失が発生する可能性があります。

単位: バイト

統計: 最も有用な統計は Sum です。

ConnectionAttemptCount

NAT ゲートウェイ経由で行われた接続試行の回数。

ConnectionEstablishedCount の値が ConnectionAttemptCount の値よりも小さい場合は、NAT ゲートウェイの背後にあるクライアントが応答のない新しい接続を確立しようとしたことを示します。

単位: 個

統計: 最も有用な統計は Sum です。

ConnectionEstablishedCount

NAT ゲートウェイ経由で確立された接続の数。

ConnectionEstablishedCount の値が ConnectionAttemptCount の値よりも小さい場合は、NAT ゲートウェイの背後にあるクライアントが応答のない新しい接続を確立しようとしたことを示します。

単位: 個

統計: 最も有用な統計は Sum です。

ErrorPortAllocation

NAT ゲートウェイが送信元ポートを割り当てられなかった回数。

値が 0 より大きい場合は、NAT ゲートウェイ経由の同時接続数が多すぎることを示します。

単位: カウント

統計: 最も有用な統計は Sum です。

IdleTimeoutCount

アクティブな状態からアイドル状態に移行した接続の数。適切に閉じられなかった場合や、直前の 350 秒間にアクティビティがなかった場合、アクティブな接続はアイドル状態に移行します。

値が 0 より大きい場合は、アイドル状態に移行した接続があることを示します。IdleTimeoutCount の値が増加する場合は、NAT ゲートウェイの背後にあるクライアントが無効な接続を再使用している可能性があります。

単位: 個

統計: 最も有用な統計は Sum です。

PacketsDropCount

NAT ゲートウェイによって破棄されたパケットの数。

値が 0 より大きい場合は、NAT ゲートウェイで進行中の一時的な問題を示している可能性があります。この値が NAT ゲートウェイ上の総トラフィックの 0.01% を超える場合は、[AWS service health dashboard] をオンにします。

単位: カウント

統計: 最も有用な統計は Sum です。

PacketsInFromDestination

NAT ゲートウェイによって受信された送信先からのパケット数。

PacketsOutToSource の値が PacketsInFromDestination の値より少ない場合、NAT ゲートウェイの処理中、またはトラフィックが NAT ゲートウェイによりアクティブにブロックされている間に、データ損失が発生する可能性があります。

単位: 個

統計: 最も有用な統計は Sum です。

PacketsInFromSource

VPC 内のクライアントから NAT ゲートウェイによって受信されたパケット数。

PacketsOutToDestination の値が PacketsInFromSource の値よりも小さい場合、NAT ゲートウェイの処理中にデータ損失が発生する可能性があります。

単位: 個

統計: 最も有用な統計は Sum です。

PacketsOutToDestination

NAT ゲートウェイ経由で送信先に送信されたパケット数。

値が 0 より大きい場合は、NAT ゲートウェイの背後にあるクライアントからインターネットへのトラフィックがあることを示します。PacketsOutToDestination の値が PacketsInFromSource の値よりも小さい場合、NAT ゲートウェイの処理中にデータ損失が発生する可能性があります。

単位: 個

統計: 最も有用な統計は Sum です。

PacketsOutToSource

VPC 内の NAT ゲートウェイ経由でクライアントに送信されたパケット数。

値が 0 より大きい場合は、インターネットから NAT ゲートウェイの背後にあるクライアントへのトラフィックがあることを示します。PacketsOutToSource の値が PacketsInFromDestination の値より少ない場合、NAT ゲートウェイの処理中、またはトラフィックが NAT ゲートウェイによりアクティブにブロックされている間に、データ損失が発生する可能性があります。

単位: 個

統計: 最も有用な統計は Sum です。

メトリクスデータをフィルタリングするために以下のディメンションを使用します。

ディメンション 説明
NatGatewayId NAT ゲートウェイ ID でメトリクスデータをフィルタリングします。

NAT ゲートウェイ CloudWatch メトリクスの表示

NAT ゲートウェイのメトリクスは 1 分間隔で CloudWatch に送信されます。メトリクスはまずサービスの名前空間ごとにグループ化され、次に各名前空間内の可能なディメンションの組み合わせごとにグループ化されます。以下のように、NAT ゲートウェイのメトリクスを表示できます。

CloudWatch コンソールを使用してメトリクスを表示するには

  1. CloudWatch コンソール (https://console.aws.amazon.com/cloudwatch/) を開きます。

  2. ナビゲーションペインで、[Metrics]、[All metrics] を選択します。

  3. [NATGateway] メトリクスの名前空間を選択します。

  4. メトリクスディメンションを選択します。

を使ってメトリクスを表示するにはAWS CLI

コマンドプロンプトで次のコマンドを使用して、NAT ゲートウェイサービスで利用可能なメトリクスを一覧表示します。

aws cloudwatch list-metrics --namespace "AWS/NATGateway"

NAT ゲートウェイをモニタリングする CloudWatch のアラームの作成

アラームの状態が変わったときに Amazon SNS メッセージを送信する Amazon CloudWatch のアラームを作成することができます。1 つのアラームで、指定した期間中、1 つのメトリクスを監視します。このアラームは、複数の期間にわたる一定のしきい値とメトリクスの値の関係性に基づき、Amazon SNS トピックに通知を送信します。

例えば、NAT ゲートウェイを出入りするトラフィックの量を監視するアラームを作成できます。次のアラームは、VPC 内のクライアントから NAT ゲートウェイ経由でインターネットに送信されるアウトバウンドトラフィックの量を監視します。15 分間でバイト数が 5,000,000 スレッドに達したときに通知を送信します。

NAT ゲートウェイ経由のアウトバウンドトラフィックのアラームを作成するには

  1. CloudWatch コンソール (https://console.aws.amazon.com/cloudwatch/) を開きます。

  2. ナビゲーションペインで、[アラーム]、[すべてのアラーム] の順に選択します。

  3. [アラームの作成] を選択します。

  4. [Select metric] (メトリクスの選択) を選択します。

  5. [NATGateway] メトリクス名前空間を選択し、メトリクスディメンションを選択します。メトリクスを表示したら、NAT ゲートウェイに関して [BytesOutToDestination] メトリクスの横にあるチェックボックスをオンにし、その後 [Select metric] を選択します。

  6. アラームを以下のように設定して、[Next] (次へ) をクリックします。

    • [統計] で、[合計] を選択します。

    • [Period] で、[15 minutes] を選択します。

    • [Whenever] で、[Greater/Equal] を選択し、しきい値は「5000000」と入力します。

  7. [Notification] で、既存の SNS トピックを選択するか、[Create new topic] を選択して新しいトピックを作成します。[Next] を選択します。

  8. 次のページで、アラームの名前と説明を入力し、[次へ] を選択します。

  9. アラームの設定が終わったら、[Create alarm] を選択します。

その他の例として、ポート割り当てをモニタリングし、3 つの連続する 5 分の間で値がゼロより大きい場合に、通知を送信するアラームを作成できます。

ポート割り当てエラーを監視するアラームを作成するには

  1. CloudWatch コンソール (https://console.aws.amazon.com/cloudwatch/) を開きます。

  2. ナビゲーションペインで、[アラーム]、[すべてのアラーム] の順に選択します。

  3. [アラームの作成] を選択します。

  4. [Select metric] (メトリクスの選択) を選択します。

  5. [NATGateway] メトリクス名前空間を選択し、メトリクスディメンションを選択します。メトリクスを表示したら、NAT ゲートウェイに関して [ErrorPortAllocation] メトリクスの横にあるチェックボックスをオンにし、その後 [Select metric] を選択します。

  6. アラームを以下のように設定して、[Next] (次へ) をクリックします。

    • [統計] で、[Maximum] を選択します。

    • [Period] で、[5 minutes] を選択します。

    • [Whenever] で、[Greater] を選択し、しきい値は「0」と入力します。

    • [追加設定]、[Datapoints to alarm] で、「3」と入力します。

  7. [Notification] で、既存の SNS トピックを選択するか、[Create new topic] を選択して新しいトピックを作成します。[Next] を選択します。

  8. 次のページで、アラームの名前と説明を入力し、[次へ] を選択します。

  9. アラームの設定が終わったら、[Create alarm] を選択します。

詳細については、『Amazon CloudWatch ユーザーガイド』の「Amazon CloudWatch アラームの使用」を参照してください。