Amazon CloudWatch Internet Monitor 작동 방식 - Amazon CloudWatch

Amazon CloudWatch Internet Monitor 작동 방식

이 섹션에서는 Amazon CloudWatch Internet Monitor의 작동 방식에 대한 정보를 제공합니다. 여기에는 AWS가 인터넷에서 연결 문제를 탐지하는 데 사용하는 데이터를 수집하는 방법과 성능 및 가용성 점수가 계산되는 방법에 대한 설명이 포함되어 있습니다.

목차

Internet Monitor에서 애플리케이션 트래픽 크기에만 초점을 맞추는 방법

Internet Monitor는 다른 도구처럼 전 세계 모든 리전의 웹 사이트를 광범위하게 모니터링하는 대신 AWS 리소스 사용자가 액세스하는 인터넷의 하위 세트만 집중적으로 모니터링합니다. 또한 대기업과 중소기업 모두에 적합한 비용 효율적인 솔루션입니다.

Internet Monitor는 AWS가 내부적으로 활용하는 것과 동일한 강력한 프로브 및 문제 탐지 알고리즘을 사용하며, Internet Monitor에서 상태 이벤트를 생성하여 애플리케이션에 영향을 주는 연결 문제를 알려줍니다. 그런 다음 Internet Monitor는 애플리케이션 리소스를 기반으로 활성 뷰어에서 생성한 트래픽 프로파일을 오버레이하여 결과 성능 및 가용성 맵에 대한 액세스를 제공합니다.

이 정보를 사용하여 Internet Monitor는 관련 이벤트(즉, 활성 시청자가 있는 위치의 이벤트)와 해당 이벤트가 전체 시청자 수에 미치는 영향만 표시합니다. 따라서 이벤트가 미치는 영향은 전 세계 총 트래픽을 기준으로 백분율로 표시됩니다.

Internet Monitor는 각 모니터에 트래픽을 전송하는 상위 500개 도시-네트워크(클라이언트 위치 및 ASN, 일반적으로 인터넷 서비스 공급업체(ISP))에 대한 인터넷 측정값을 5분마다 CloudWatch 로그에 게시합니다. 원하는 경우, 모니터링되는 모든 도시-네트워크(최대 500,000개의 도시-네트워크 서비스 제한)에 대한 인터넷 측정값을 Amazon S3 버킷에 게시하도록 선택할 수 있습니다. 자세한 내용은 Amazon CloudWatch Internet Monitor에서 Amazon S3에 인터넷 측정값 게시 단원을 참조하십시오.

Internet Monitor는 다음과 같은 이점이 있습니다.

  • Internet Monitor를 사용해도 AWS에서 호스팅되는 애플리케이션에 추가 로드나 비용이 발생하지 않습니다.

  • 클라이언트 측 리소스나 애플리케이션에 성능 측정 코드를 포함할 필요가 없습니다.

  • 애플리케이션이 연결된 인터넷에서 '라스트 마일' 정보를 비롯하여 성능 및 가용성에 대한 가시성을 얻을 수 있습니다.

Internet Monitor는 AWS 리소스를 기반으로 측정값을 생성하기 때문에 Internet Monitor는 애플리케이션 트래픽에 특정한 이벤트만 생성합니다. 일반적으로 글로벌 인터넷 문제는 보고되지 않습니다. 또한 서비스 위치가 AWS 리전인 경우 방출된 측정값과 이벤트는 리전 수준의 연결을 나타내도록 설계되었으며 최종 사용자 위치와 가용 영역 간의 연결을 정확하게 나타내지 않습니다.

AWS에서 연결 문제를 측정하고 측정값을 계산하는 방법

Amazon CloudWatch Internet Monitor는 Autonomous System Number(ASN)(일반적으로 인터넷 서비스 제공업체(ISP))를 통해 서로 다른 AWS 리전 및 서로 다른 클라이언트 위치에 대한 Amazon CloudFront 접속 지점(POP) 간 인터넷 연결 데이터를 사용합니다. AWS 운영자는 매일 이 연결 데이터를 내부적으로 사용하여 전 세계 인터넷에서 연결 문제를 사전에 탐지합니다.

모든 AWS 리전마다 인터넷의 어느 부분이 지역과 통신하는지 파악하고 다음을 수행합니다.

  • 인터넷의 이러한 부분은 30일의 롤링 기간 동안 적극적으로 모니터링됩니다.

  • 인바운드 및 아웃바운드 프로빙을 모두 포함하여 네트워크 및 상위 수준 프로토콜 프로브를 모두 사용합니다.

AWS에는 모든 AWS 리전 및 CloudFront 서비스에서 전체 인터넷에 이르는 90번째 백분위수의 지연 시간(성능)과 연결성(가용성)을 측정하는 능동 및 수동 프로브가 있습니다. 서비스와 고객 위치 간의 비정상적인 연결 패턴이 모니터링된 다음, 고객에게 경고로 보고됩니다.

가용성 및 RTT 계산

왕복 시간(RTT)은 사용자의 요청이 사용자에게 응답을 반환하는 데 걸리는 시간입니다. 최종 사용자 위치 전체에서 왕복 시간이 집계되면 값은 각 최종 사용자 위치에서 유도하는 트래픽 양에 따라 가중치가 부여됩니다.

예를 들어, 최종 사용자 위치가 두 개이며 하나는 5ms RTT로 트래픽의 90%를 처리하고 다른 하나는 10ms RTT로 트래픽의 10%를 처리하는 경우 결과는 5.5ms(5ms * 0.9 + 10ms * 0.1)의 집계 RTT입니다.

단, 마지막 마일 지연 시간 측정과 관련된 리소스에는 차이가 있습니다. Internet Monitor 지연 시간 측정의 경우 VPC, Network Load Balancer, WorkSpaces 디렉터리에는 마지막 마일 지연 시간이 포함되지 않습니다.

성능 및 가용성 점수 계산

AWS는 AWS 서비스와 다양한 도시-네트워크(위치 및 ASN) 간의 인터넷 성능 및 가용성에 대한 상당한 과거 데이터를 보유하고 있습니다. Internet Monitor는 데이터에 통계 분석을 적용하여 애플리케이션의 성능 및 가용성이 계산한 예상 기준선과 비교하여 언제 저하되었는지 탐지할 수 있습니다. 이러한 성능 저하를 쉽게 확인할 수 있도록 해당 정보는 성능 점수와 가용성 점수라는 상태 점수의 형태로 사용자에게 보고됩니다.

상태 점수는 서로 다른 세부 수준으로 계산됩니다. 가장 세분화된 수준에서는 도시 또는 대도시 리전과 같은 지리적 리전과 ASN(도시-네트워크)에 대한 상태 점수를 계산합니다. 또한 모니터의 애플리케이션에 대한 개별 건강 점수가 전체 상태 점수 숫자로 롤업됩니다. 특정 지역 또는 서비스 제공업체에 대한 필터링 없이 성능 또는 가용성 점수를 볼 경우 Internet Monitor는 전체 상태 점수를 제공합니다.

전체 상태 점수는 지정된 기간 동안 전체 애플리케이션에 적용됩니다. 애플리케이션의 도시-네트워크 쌍에 대한 애플리케이션의 성능 또는 가용성 점수가 성능 또는 가용성에 대한 해당 상태 이벤트 임계값에 도달하거나 그 이하로 떨어지면 Internet Monitor에서 상태 이벤트를 트리거합니다. 기본적으로 임계값은 전체 성능과 가용성 모두에 대해 95%입니다. 또한 Internet Monitor는 로컬 임계값을 기반으로 (이 옵션이 활성화된 경우 기본적으로 구성한 값 그대로) 상태 이벤트를 생성합니다. 상태 이벤트 임계값 구성에 대해 자세히 알아보려면 상태 이벤트 임계값 변경을 참조하세요.

모니터 및 로그 파일에서 정보를 탐색하여 문제를 조사하고 자세한 내용을 알아볼 때 특정 도시(위치), 네트워크(ASN 또는 인터넷 서비스 제공업체) 또는 두 가지 모두를 기준으로 필터링할 수 있습니다. 따라서 필터를 사용하여 선택한 필터에 따라 다른 도시, ASN 또는 도시-네트워크 쌍에 대한 상태 점수를 확인할 수 있습니다.

  • 가용성 점수는 가용성 저하가 나타나지 않는 트래픽의 예상 백분율을 나타냅니다. Internet Monitor는 표시된 총 트래픽 및 가용성 지표 측정값에서 저하를 경험하는 트래픽의 백분율을 추정합니다. 예를 들어 최종 사용자와 서비스 위치 쌍의 가용성 점수 99%는 해당 쌍에 대해 가용성 저하를 경험하는 트래픽의 1%와 같습니다.

  • 성능 점수는 성능 저하가 나타나지 않는 트래픽의 백분율을 나타냅니다. 예를 들어 최종 사용자와 서비스 위치 쌍의 가용성 점수 99%는 해당 쌍에 대해 성능 저하를 경험하는 트래픽의 1%와 같습니다.

TTFB 및 RTT(지연 시간) 계산

첫 바이트까지 시간(TTFB)은 클라이언트가 요청을 할 때와 서버로부터 첫 바이트의 정보를 수신할 때 사이의 시간을 의미합니다. AWS TTFB에 대한 계산은 Amazon EC2 또는 Amazon CloudFront에서 Internet Monitor 측정 노드(노드의 마지막 마일 포함)까지 경과한 시간을 측정합니다. 즉, Internet Monitor는 EC2에 대한 TTFB의 경우 사용자에서 Amazon EC2 리전까지의 시간을 측정하고, CloudFront에 대한 TTFB의 경우 사용자에서 CloudFront까지의 시간을 측정합니다.

왕복 시간(RTT)의 경우 Internet Monitor에는 퍼블릭 IP 주소로 매핑된 도시-네트워크(즉, 클라이언트 위치와 ASN, 일반적으로 인터넷 서비스 공급업체)부터 AWS 리전까지의 시간이 포함됩니다. 즉, Internet Monitor는 게이트웨이 또는 VPN 뒤에서 인터넷에 액세스하는 사용자에 대한 마지막 마일 가시성을 제공하지 않습니다.

단, 마지막 마일 지연 시간 측정과 관련된 리소스에는 차이가 있습니다. Internet Monitor 지연 시간 측정의 경우 VPC, Network Load Balancer, WorkSpaces 디렉터리에는 마지막 마일 지연 시간이 포함되지 않습니다.

Internet Monitor는 CloudWatch 대시보드의 트래픽 인사이트 탭에 있는 트래픽 최적화 제안 섹션에 평균 TTFB 정보를 제공하여 성능을 향상시킬 수 있는 애플리케이션의 다양한 설정 옵션을 평가할 수 있도록 도와줍니다.

리전 및 가용 영역 측정 및 집계

Internet Monitor는 측정값을 집계하고 리전 수준에서 해당 영향을 공유하지만, 영향을 계산하는 수준은 가용 영역(AZ)입니다. 즉, 이벤트가 발생했을 때 하나의 AZ만 영향을 받고 대부분의 트래픽이 해당 AZ를 통과하는 경우 트래픽에 미치는 영향을 확인할 수 있습니다. 하지만 동일한 이벤트에서 애플리케이션 트래픽이 영향을 받는 AZ를 통과하지 않으면 영향을 확인할 수 없습니다.

이는 WorkSpaces 디렉터리가 아닌 리소스에만 적용됩니다. WorkSpaces 디렉터리는 리전 수준에서만 측정됩니다.

Internet Monitor의 지리적 위치 정확도

위치 정보의 경우 Internet Monitor는 MaxMind에서 제공하는 IP-지리적 위치 데이터를 사용합니다. Internet Monitor 측정의 위치 정보 정확도는 MaxMind 데이터의 정확도에 따라 달라집니다.

미국 이외의 지역에서는 Metro 수준의 측정이 정확하지 않을 수 있습니다.

Internet Monitor가 상태 이벤트를 생성하고 해결하는 경우

Internet Monitor는 설정된 현재 임계값에 따라 모니터하는 애플리케이션 트래픽에 대한 상태 이벤트를 생성하고 종료합니다. Internet Monitor에는 기본 임계값 구성이 있으며 임계값에 대한 고유한 구성을 설정할 수도 있습니다. Internet Monitor는 연결 문제가 애플리케이션에 미치는 전반적인 영향과 애플리케이션에 클라이언트가 있는 로컬 영역에 미치는 영향을 파악하고 임계값을 초과하면 상태 이벤트를 생성합니다.

Internet Monitor는 AWS를 통해 서비스에 제공되는 네트워크 트래픽의 인터넷 성능 및 가용성에 대한 기록 데이터를 기반으로 클라이언트 위치에 대한 연결 문제의 영향을 계산합니다. 클라이언트가 애플리케이션을 사용하는 ASN 및 서비스의 지리적 위치(영향을 받는 도시-네트워크 쌍)를 기반으로 애플리케이션과 관련된 정보를 적용합니다. 위치는 모니터에 추가하는 리소스에 따라 결정됩니다. 그런 다음 Internet Monitor는 통계 분석을 사용하여 성능 및 가용성이 저하되어 애플리케이션의 클라이언트 환경에 영향을 미치는 시점을 탐지합니다.

Internet Monitor가 계산하는 성능 및 가용성 점수는 감소하지 않은 트래픽의 백분율로 표시됩니다. 영향은 이와 반대입니다. 즉, 고객의 최종 사용자에게 얼마나 문제가 되는지를 나타내는 수치입니다. 따라서 예를 들어 글로벌 가용성이 93% 저하하는 경우 해당 영향은 7%입니다.

애플리케이션의 도시-네트워크 쌍에 대한 전 세계 성능 또는 가용성 점수가 성능 또는 가용성에 대한 해당 상태 이벤트 임계값에 도달하거나 그 이하로 떨어지면 Internet Monitor에서 상태 이벤트를 생성합니다. 기본적으로 임계값은 성능과 가용성 모두에 대해 95%입니다. 임계값을 충족하거나 그 이하로 떨어지는 값은 누적되므로 여러 개의 작은 이벤트가 합쳐져 임계값 백분율을 충족하거나 단일 이벤트가 임계값 수준을 충족하거나 그 이하로 떨어질 수 있습니다.

이벤트를 트리거한 성능 또는 가용성 점수가 전체 영향에 대한 해당 상태 이벤트 임계값 백분율 이하인 한, 상태 이벤트는 활성 상태로 유지됩니다. 이벤트를 트리거한 점수 또는 합산 점수가 임계값을 초과하면 Internet Monitor가 상태 이벤트를 해결합니다.

또한 Internet Monitor는 로컬 임계값과 문제가 영향을 미치는 전체 트래픽의 백분율을 기반으로 상태 이벤트를 생성합니다. 로컬 임계값에 대한 옵션을 구성하거나 로컬 임계값을 모두 해제할 수 있습니다.

상태 이벤트 임계값 구성에 대해 자세히 알아보려면 상태 이벤트 임계값 변경을 참조하세요.

상태 이벤트 보고 타이밍

Internet Monitor는 애그리게이터를 사용하여 인터넷 문제에 대한 모든 신호를 수집하고 몇 분 안에 모니터에서 상태 이벤트를 생성합니다.

가능한 경우 Internet Monitor는 상태 이벤트의 원인을 분석하여 AWS 또는 ASN으로 인한 것인지 확인합니다. 상태 이벤트 분석은 이벤트가 해결된 후에도 계속됩니다. Internet Monitor는 최대 1시간 동안 새로운 정보로 이벤트를 업데이트할 수 있습니다.

Internet Monitor는 IPv4 및 IPv6 트래픽에서 작동하는 방식

Internet Monitor는 모든 IP 패밀리를 통해 해당 네트워크에 트래픽을 전송하는 경우 IPv4만을 통해 네트워크의 상태를 측정하고 상태 이벤트와 가용성 및 성능 지표를 표시합니다(IPv4 또는 IPv6). 이중 스택 CloudFront 배포와 같은 이중 스택 리소스에서 트래픽을 서비스하는 경우 Internet Monitor는 IPv4 트래픽이 리소스에 대해 IPv6 트래픽과 동일한 문제가 있는 경우에만 상태 이벤트를 발생시키고 성능 점수 또는 가용성 점수의 하락을 표시합니다.

전체 바이트 수신 및 바이트 발신에 대한 Internet Monitor 지표는 모든 인터넷 트래픽(IPv4 및 IPv6)을 정확하게 반영합니다.

Internet Monitor에서 포함할 도시 네트워크의 하위 집합을 선택하는 방법

모니터로 모니터링하는 도시 네트워크 수의 최대 제한을 설정하거나 모니터링할 트래픽 비율을 선택하면 Internet Monitor에서 최근 가장 많은 트래픽 볼륨을 기준으로 포함(모니터링)할 도시 네트워크를 선택합니다.

예를 들어 도시 네트워크 최대 제한을 100개로 설정하면 Internet Monitor는 최근 1시간 동안 애플리케이션 트래픽을 기반으로 최대 100개의 도시 네트워크를 모니터링합니다. 특히, Internet Monitor에서는 최근 1시간 이전의 1시간 동안 트래픽이 가장 많은 상위 100개 도시 네트워크를 모니터링합니다.

이를 설명하기 위해 현재 시간이 오후 2시 30분이라고 가정합니다. 이 시나리오에서 모니터에 표시되는 트래픽은 오후 1시에서 2시 사이에 캡처되었으며, Internet Monitor에서 상위 100개 도시 네트워크를 결정하는 데 사용하는 트래픽 볼륨은 오후 12시에서 1시 사이에 캡처되었습니다.

글로벌 인터넷 웨더 맵의 생성 방식(자주 묻는 질문)

Amazon CloudWatch Internet Monitor 인터넷 웨더 맵은 Internet Monitor 콘솔에서 인증된 모든 AWS 고객에게 제공됩니다. 이 섹션에는 인터넷 웨더 맵이 생성되는 방법과 사용 방법에 관한 세부 정보가 포함되어 있습니다.

Internet Monitor 웨더 맵이란 무엇인가요?

인터넷 웨더 맵은 전 세계의 인터넷 문제를 시각적으로 보여줍니다. 영향을 받는 클라이언트 위치, 즉 도시와 ASN(일반적으로 인터넷 서비스 제공업체)을 강조 표시합니다. 이 맵에는 최근 전 세계 주요 고객 위치 및 AWS 서비스에 대해 고객의 인터넷 경험에 영향을 미친 가용성 및 성능 문제가 복합적으로 표시되어 있습니다.

맵 데이터의 출처는 어디인가요?

데이터는 능동형 및 수동형 인터넷 탐색의 조합을 기반으로 합니다. Internet Monitor가 데이터를 측정하는 방법을 자세히 알아보려면 AWS의 연결 문제 측정 방법 섹션을 읽어보세요.

맵은 얼마나 자주 업데이트되나요?

인터넷 웨더 맵은 15분마다 업데이트됩니다.

어떤 네트워크에서 중단이 추적되나요?

AWS는 고객이 AWS로의 인터넷 연결에 사용하는 중요한 IP 접두사를 나타내는 전 세계 네트워크를 추적합니다. AWS 네트워크로 송수신되는 트래픽 양이 가장 많은 클라이언트 위치를 대상으로 중단 범위를 파악합니다.

인터넷 이벤트가 맵에 포함되는지 여부는 어떻게 결정되나요?

다음은 인터넷 이벤트가 인터넷 웨더 맵에 포함되는지 여부를 결정하는 데 사용되는 몇 가지 대략적인 기준입니다.

  • AWS는 가용성 또는 성능 이벤트가 있는지 감지합니다.

  • 예를 들어 이벤트 길이가 5분 미만인 경우 이 이벤트는 무시됩니다.

  • 그리고 상위 토커로 분류된 클라이언트 위치에서 이벤트가 발생하면 중단으로 간주됩니다.

인터넷 웨더 맵에는 어떤 임계값이 사용되나요?

인터넷 웨더 맵의 중단 결정 임계값은 고정되어 있지 않습니다. Internet Monitor는 예상하는 값과의 편차를 감지하여 이벤트를 구성하는 요소를 결정합니다. 서비스로 생성한 모니터에 대해 Internet Monitor에서 상태 이벤트를 생성하는 시기를 결정하는 방식을 검토하여 그 방법을 자세히 알아볼 수 있습니다. 모니터를 생성하면 Internet Monitor는 사용자의 애플리케이션 트래픽과 관련된 인터넷 트래픽 상태 측정치를 생성합니다. 또한 Internet Monitor는 애플리케이션의 인터넷 트래픽에 영향을 미치는 문제에 대한 상태 이벤트 경보를 보냅니다.

이 데이터로 무엇을 할 수 있나요?

인터넷 웨더 맵은 지난 24시간 동안 전 세계에서 발생한 주요 인터넷 이벤트를 간략하게 요약합니다. 이를 통해 자신의 인터넷 트래픽을 Internet Monitor에 온보딩할 필요 없이 다양한 인터넷 모니터링 경험을 얻을 수 있습니다. AWS의 인터넷 모니터링 기능을 최대한 활용하고 AWS에서 호스팅되는 애플리케이션 및 서비스에 맞춰 개인화하기 위해 Internet Monitor에서 모니터를 생성할 수 있습니다.

모니터를 생성하면 Internet Monitor를 활성화하여 애플리케이션 클라이언트에 영향을 미치는 특정 인터넷 경로를 식별하고, 클라이언트 경험을 개선하는 데 도움이 되는 기능에 액세스할 수 있습니다. 또한 특히 애플리케이션 트래픽과 클라이언트에 영향을 미치는 새로운 인터넷 문제에 대해 미리 알림을 받을 수 있습니다.

이벤트에 관한 세부 정보는 어떻게 얻을 수 있나요?

맵에서 중단을 클릭하면 이벤트 시작 및 종료 시간, 영향을 받는 도시 및 ASN, 발생한 문제 유형(성능 문제 또는 가용성 문제) 등의 세부 정보를 볼 수 있습니다.

이벤트에 관한 세부 정보를 얻고 애플리케이션 트래픽에 대한 사용자 지정 측정치를 얻으려면 Internet Monitor에서 모니터를 생성합니다.