Amazon CloudWatch를 사용하여 NAT 게이트웨이 모니터링 - Amazon Virtual Private Cloud

Amazon CloudWatch를 사용하여 NAT 게이트웨이 모니터링

CloudWatch를 이용하여 NAT 게이트웨이를 모니터링하면 NAT 게이트웨이에 대한 정보를 수집하고, 거의 실시간에 가까운 읽기 가능한 지표를 만들 수 있습니다. 이 정보를 사용하여 NAT 게이트웨이를 모니터링하고 문제를 해결할 수 있습니다. NAT 게이트웨이 지표 데이터는 1분마다 제공되며, 통계는 15개월 동안 기록됩니다.

Amazon CloudWatch에 대한 자세한 내용은 Amazon CloudWatch 사용 설명서를 참조하세요. 요금에 대한 자세한 정보는 Amazon CloudWatch 요금을 참조하세요.

NAT 게이트웨이 지표 및 차원

NAT 게이트웨이에 사용할 수 있는 측정치는 아래와 같습니다.

측정치 설명
ActiveConnectionCount

NAT 게이트웨이를 통한 동시 활성 TCP 연결의 총 수입니다.

0의 값은 NAT 게이트웨이를 통한 활성 연결이 없음을 나타냅니다.

단위: 개수

통계: 가장 유용한 통계는 Max입니다.

BytesInFromDestination

NAT 게이트웨이가 대상으로부터 수신한 바이트 수입니다.

BytesOutToSource 값이 BytesInFromDestination 값보다 작은 경우, NAT 게이트웨이 처리 중에 데이터 손실이 있거나 NAT 게이트웨이가 적극적으로 차단하는 트래픽이 있을 수도 있습니다.

단위: 바이트

통계: 가장 유용한 통계는 Sum입니다.

BytesInFromSource

NAT 게이트웨이가 VPC 내 클라이언트로부터 수신한 바이트 수입니다.

BytesOutToDestination 값이 BytesInFromSource 값보다 작은 경우, NAT 게이트웨이 처리 중에 데이터 손실이 있을 수도 있습니다.

단위: 바이트

통계: 가장 유용한 통계는 Sum입니다.

BytesOutToDestination

NAT 게이트웨이를 통해 대상으로 전송된 바이트 수입니다.

0보다 큰 값은 NAT 게이트웨이 뒤에 있는 클라이언트에서 인터넷으로 가는 트래픽이 있음을 나타냅니다. BytesOutToDestination 값이 BytesInFromSource 값보다 작은 경우, NAT 게이트웨이 처리 중에 데이터 손실이 있을 수도 있습니다.

단위: 바이트

통계: 가장 유용한 통계는 Sum입니다.

BytesOutToSource

NAT 게이트웨이를 통해 VPC 내 클라이언트로 전송된 바이트 수입니다.

0보다 큰 값은 인터넷에서 NAT 게이트웨이 뒤에 있는 클라이언트로 오는 트래픽이 있음을 나타냅니다. BytesOutToSource 값이 BytesInFromDestination 값보다 작은 경우, NAT 게이트웨이 처리 중에 데이터 손실이 있거나 NAT 게이트웨이가 적극적으로 차단하는 트래픽이 있을 수도 있습니다.

단위: 바이트

통계: 가장 유용한 통계는 Sum입니다.

ConnectionAttemptCount

NAT 게이트웨이를 통해 이루어진 연결 시도 횟수.

ConnectionEstablishedCount 값이 ConnectionAttemptCount 값보다 작은 경우, NAT 게이트웨이 뒤의 클라이언트가 응답이 없는 새 연결을 시도했음을 나타냅니다.

단위: 수

통계: 가장 유용한 통계는 Sum입니다.

ConnectionEstablishedCount

NAT 게이트웨이를 통해 설정된 연결 수.

ConnectionEstablishedCount 값이 ConnectionAttemptCount 값보다 작은 경우, NAT 게이트웨이 뒤의 클라이언트가 응답이 없는 새 연결을 시도했음을 나타냅니다.

단위: 수

통계: 가장 유용한 통계는 Sum입니다.

ErrorPortAllocation

NAT 게이트웨이가 소스 포트 할당에 실패한 횟수.

0보다 큰 값은 너무 많은 동시 연결이 NAT 게이트웨이를 통해 열려 있음을 나타냅니다.

단위: 개수

통계: 가장 유용한 통계는 Sum입니다.

IdleTimeoutCount

활성 상태가 유휴 상태로 전환된 연결 수입니다. 활성 연결은 적절하게 종료되지 않고 직전 350초 동안 활동이 없는 경우 유휴 상태로 전환됩니다.

0보다 큰 값은 유휴 상태로 이동된 연결이 있었음을 나타냅니다. IdleTimeoutCount 값이 증가하는 경우, NAT 게이트웨이 뒤의 클라이언트가 부실 연결을 재사용하고 있음을 나타낼 수도 있습니다.

단위: 수

통계: 가장 유용한 통계는 Sum입니다.

PacketsDropCount

NAT 게이트웨이가 삭제한 패킷 수입니다.

0보다 큰 값은 NAT 게이트웨이에 일시적 문제가 있음을 나타낼 수도 있습니다. 이 값이 NAT 게이트웨이 총 트래픽의 0.01퍼센트를 초과하는 경우 AWSService Health Dashboard를 확인하십시오.

단위: 개수

통계: 가장 유용한 통계는 Sum입니다.

PacketsInFromDestination

NAT 게이트웨이가 대상으로부터 수신한 패킷 수입니다.

PacketsOutToSource 값이 PacketsInFromDestination 값보다 작은 경우, NAT 게이트웨이 처리 중에 데이터 손실이 있거나 NAT 게이트웨이가 적극적으로 차단하는 트래픽이 있을 수도 있습니다.

단위: 수

통계: 가장 유용한 통계는 Sum입니다.

PacketsInFromSource

NAT 게이트웨이가 VPC 내 클라이언트로부터 수신한 패킷 수입니다.

PacketsOutToDestination 값이 PacketsInFromSource 값보다 작은 경우, NAT 게이트웨이 처리 중에 데이터 손실이 있을 수도 있습니다.

단위: 수

통계: 가장 유용한 통계는 Sum입니다.

PacketsOutToDestination

NAT 게이트웨이를 통해 대상으로 전송된 패킷 수입니다.

0보다 큰 값은 NAT 게이트웨이 뒤에 있는 클라이언트에서 인터넷으로 가는 트래픽이 있음을 나타냅니다. PacketsOutToDestination 값이 PacketsInFromSource 값보다 작은 경우, NAT 게이트웨이 처리 중에 데이터 손실이 있을 수도 있습니다.

단위: 수

통계: 가장 유용한 통계는 Sum입니다.

PacketsOutToSource

NAT 게이트웨이를 통해 VPC 내 클라이언트로 전송된 패킷 수입니다.

0보다 큰 값은 인터넷에서 NAT 게이트웨이 뒤에 있는 클라이언트로 오는 트래픽이 있음을 나타냅니다. PacketsOutToSource 값이 PacketsInFromDestination 값보다 작은 경우, NAT 게이트웨이 처리 중에 데이터 손실이 있거나 NAT 게이트웨이가 적극적으로 차단하는 트래픽이 있을 수도 있습니다.

단위: 수

통계: 가장 유용한 통계는 Sum입니다.

지표 데이터를 필터링하려면 다음 차원을 사용하세요.

차원 설명
NatGatewayId NAT 게이트웨이 ID를 기준으로 측정치 데이터를 필터링합니다.

NAT 게이트웨이 CloudWatch 지표 보기

NAT 게이트웨이 지표는 1분 가격으로 CloudWatch로 전송됩니다. 지표는 먼저 서비스 네임스페이스별로 그룹화된 다음, 각 네임스페이스 내에서 가능한 차원 조합에 따라 그룹화됩니다. NAT 게이트웨이에 대해 다음과 같이 측정치를 볼 수 있습니다.

CloudWatch 콘솔을 사용하여 지표를 확인하려면

  1. https://console.aws.amazon.com/cloudwatch/에서 CloudWatch 콘솔을 엽니다.

  2. 탐색 창에서 지표, 모든 지표를 선택합니다.

  3. NATGateway 지표 네임스페이스를 선택합니다.

  4. 지표 차원을 선택합니다.

를 사용하여 지표를 보려면AWS CLI

명령 프롬프트에서 다음 명령을 사용하여 NAT 게이트웨이 서비스에 사용 가능한 지표 목록을 확인합니다.

aws cloudwatch list-metrics --namespace "AWS/NATGateway"

NAT 게이트웨이를 모니터링하기 위한 CloudWatch 경보 생성

경보로 인해 상태가 변경되면 Amazon SNS 메시지를 보내는 CloudWatch 경보를 생성할 수 있습니다. 경보는 지정한 기간 동안 단일 지표를 감시합니다. 경보는 기간 수에 대한 주어진 임계값과 지표 값을 비교하여 Amazon SNS 주제에 알림을 보냅니다.

예를 들어 NAT 게이트웨이로 들어오거나 나가는 트래픽의 양을 모니터링하는 경보를 만들 수 있습니다. 아래 경보는 NAT 게이트웨이를 통해 VPC의 클라이언트에서 인터넷으로 가는 아웃바운드 트래픽의 양을 모니터링합니다. 그리고 15분 동안 바이트 수가 임계값인 5,000,000에 도달하면 알림을 보냅니다.

NAT 게이트웨이를 통한 아웃바운드 트래픽에 대한 경보를 만들려면

  1. https://console.aws.amazon.com/cloudwatch/에서 CloudWatch 콘솔을 엽니다.

  2. 탐색 창에서 경보, 모든 경보를 선택합니다.

  3. 경보 생성(Create alarm)을 선택하세요.

  4. 지표 선택(Select metric)을 선택하세요.

  5. NATGateway 지표 네임스페이스를 선택한 다음 지표 차원을 선택합니다. 지표를 가져오면 NAT 게이트웨이에 대한 BytesOutToDestination 지표 옆 확인란을 선택한 다음 지표 선택을 선택합니다.

  6. 경보를 다음과 같이 구성한 다음 다음(Next)을 선택합니다.

    • 통계(Statistic)에서 합계(Sum)를 선택합니다.

    • 기간에서 15분을 선택합니다.

    • 항상에서 초과/같음을 선택하고 임계값으로 5000000을 입력합니다.

  7. 알림에서 기존 SNS 주제를 선택하거나 새 주제 생성을 선택하여 새로 생성합니다. 다음을 선택합니다.

  8. 경보의 이름과 설명을 입력하고 다음을 선택합니다.

  9. 경보 구성을 마쳤으면 경보 생성을 선택합니다.

다른 예와 같이, 포트 할당 오류를 모니터링하는 경보를 만들고 이 값이 3회 연속 5분간 0보다 클 경우에 알림을 보낼 수 있습니다.

경보를 만들어 포트 할당 오류를 모니터링하려면

  1. https://console.aws.amazon.com/cloudwatch/에서 CloudWatch 콘솔을 엽니다.

  2. 탐색 창에서 경보 모든 경보를 선택합니다.

  3. 경보 생성(Create alarm)을 선택하세요.

  4. 지표 선택(Select metric)을 선택하세요.

  5. NATGateway 지표 네임스페이스를 선택한 다음 지표 차원을 선택합니다. 지표를 가져오면 NAT 게이트웨이에 대한 ErrorPortAllocation 지표 옆 확인란을 선택한 다음 지표 선택을 선택합니다.

  6. 경보를 다음과 같이 구성한 다음 다음(Next)을 선택합니다.

    • 통계에서 최대를 선택합니다.

    • 기간에서 5분을 선택합니다.

    • 항상에서 초과를 선택하고 임계값으로 0을 입력합니다.

    • 추가 구성에서 경보를 생성할 데이터 포인트에 대해 3을 입력합니다.

  7. 알림에서 기존 SNS 주제를 선택하거나 새 주제 생성을 선택하여 새로 생성합니다. 다음을 선택합니다.

  8. 경보의 이름과 설명을 입력하고 다음을 선택합니다.

  9. 경보 구성이 완료되면 경보 생성을 선택합니다.

자세한 정보는 Amazon CloudWatch 사용 설명서Amazon CloudWatch 경보 사용을 참조하세요.