CloudWatch 이상 탐지 사용 - Amazon CloudWatch

CloudWatch 이상 탐지 사용

지표에 대해 ‘이상 탐지’를 사용 설정하면 CloudWatch는 통계 및 기계 학습 알고리즘을 적용합니다. 이러한 알고리즘은 시스템 및 애플리케이션의 지표를 지속적으로 분석하고, 정상 기준을 결정하며, 최소한의 사용자 개입으로 이상을 나타냅니다.

알고리즘은 이상 탐지 모델을 생성합니다. 모델은 정상 지표 동작을 나타내는 예상 값의 범위를 생성합니다.

AWS Management Console, AWS CLI, AWS CloudFormation 또는 AWS SDK를 사용하여 이상 탐지를 활성화할 수 있습니다. AWS에서 판매한 지표에 대해 및 사용자 정의 지표에 대해 이상 탐지를 활성화할 수 있습니다. CloudWatch 교차 계정 관찰성을 위해 모니터링 계정으로 설정된 계정에서 모니터링 계정의 지표뿐만 아니라 소스 계정의 지표에도 이상 탐지기를 만들 수 있습니다.

기댓값 모델을 두 가지 방법으로 사용할 수 있습니다.

  • 지표의 예상 값을 기반으로 이상 탐지 경보를 생성합니다. 이러한 유형의 경보에는 경보 상태를 확인하기 위한 정적 임계값이 없습니다. 대신 이상 탐지 모델을 기반으로 지표의 값을 예상 값과 비교합니다.

    지표 값이 예상 값의 밴드보다 높거나, 밴드보다 낮거나, 두 경우에 모두 해당할 때 경보를 트리거하도록 선택할 수 있습니다.

    자세한 내용은 이상 탐지를 기반으로 CloudWatch 경보 생성 단원을 참조하세요.

  • 지표 데이터의 그래프를 볼 때 예상 값을 그래프에 밴드로 오버레이합니다. 이렇게 하면 그래프의 어떤 값이 정상 범위를 벗어났는지 시각적으로 알 수 있습니다. 자세한 내용은 그래프 생성 단원을 참조하십시오.

    또한, ANOMALY_DETECTION_BAND 지표 수학 함수가 있는 GetMetricData API 요청을 사용하여 모델 밴드의 상위 값과 하위 값을 검색할 수 있습니다. 자세한 내용은 GetMetricData 단원을 참조하세요.

이상 탐지가 있는 그래프에서 예상 값의 범위는 회색 밴드로 표시됩니다. 지표의 실제 값이 이 밴드를 초과하면 해당 시간 동안 빨간색으로 표시됩니다.

이상 탐지 알고리즘은 지표의 계절성 및 추세 변화를 설명합니다. 계절성 변화는 다음 예와 같이 시간별, 일별 또는 주별일 수 있습니다.

CPUUtilization 지표에 대해 사용 설정된 이상 탐지를 보여 주는 지표 콘솔입니다.
CPUUtilization 지표에 대해 사용 설정된 이상 탐지를 보여 주는 지표 콘솔입니다.
CPUUtilization 지표에 대해 사용 설정된 이상 탐지를 보여 주는 지표 콘솔입니다.

장거리 추세는 하향 또는 상향 추세가 될 수 있습니다.

CPUUtilization 지표에 대해 사용 설정된 이상 탐지를 보여 주는 지표 콘솔입니다.

이상 탐지는 플랫 패턴이 있는 지표에서도 잘 작동합니다.

CPUUtilization 지표에 대해 사용 설정된 이상 탐지를 보여 주는 지표 콘솔입니다.

CloudWatch 이상 탐지의 작동 방식

지표에 대해 이상 탐지를 사용 설정하면 CloudWatch는 기계 학습 알고리즘을 지표의 과거 데이터에 적용하여 지표의 예상 값 모델을 생성합니다. 모델은 지표의 추세와 시간별, 일별 및 주별 패턴을 모두 평가합니다. 이 알고리즘은 최대 2주의 지표 데이터를 교육할 수 있지만, 지표에 2주분의 데이터가 없더라도 지표에 이상 탐지를 활성화할 수 있습니다.

CloudWatch가 모델과 함께 지표 값의 ‘정상’ 범위를 결정하는 데 사용하는 이상 탐지 임계값에 대한 값을 지정합니다. 이상 탐지 임계값의 값이 높을수록 “정상” 값의 밴드가 두꺼워집니다.

기계 학습 모델은 지표 및 통계에 고유합니다. 예를 들어, AVG 통계를 사용한 지표에 대한 이상 탐지를 활성화하면, 해당 모델은 AVG 통계에 고유합니다.

CloudWatch는 AWS 서비스의 많은 공통 지표에 대한 모델을 생성할 때 밴드가 논리적 값을 벗어나지 않도록 합니다. 예를 들어, EC2 인스턴스의 MemoryUtilization 대역은 0에서 100 사이로 유지되고, CloudFront Requests를 추적하는 대역(음수일 수 없음)은 0 이하로 확장되지 않습니다.

모델을 생성한 후 CloudWatch 이상 탐지는 지속적으로 모델을 평가하며 모델이 가능한 한 정확성을 유지하도록 모델을 조정합니다. 여기에는 지표 값이 시간 경과에 따라 점진적으로 변화하거나 갑작스럽게 변하는 경우에 조정하기 위해 모델을 다시 훈련하는 것이 포함되며, 계절성 또는 희소성이거나 급증하는 지표의 모델을 개선하기 위한 예측 변수도 포함됩니다.

지표에 이상 탐지를 활성화한 다음 모델을 교육할 때, 지표에 특정 기간을 사용하지 않도록 제외할 수 있습니다. 이렇게 하면, 모델 교육을 할 때 배포 또는 다른 이상 이벤트 등을 제외할 수 있어 가장 정확한 모델을 생성할 수 있습니다.

경보용 이상 탐지 모델을 사용하면 AWS 계정에 비용이 청구됩니다. 자세한 내용은 Amazon CloudWatch 요금을 참조하세요.

지표 수학에 대한 이상 탐지

지표 수학에 대한 이상 탐지는 출력 지표 수학 표현식에 대한 이상 탐지 경보를 생성하는 데 사용할 수 있는 기능입니다. 이러한 표현식을 사용하여 이상 탐지 밴드를 시각화하는 그래프를 만들 수 있습니다. 이 기능은 기본 산술 함수, 비교 및 논리 연산자 및 대부분의 기타 함수를 지원합니다. 지원되지 않는 함수에 대한 자세한 내용은 Amazon CloudWatch 사용 설명서지표 수학 사용을 참조하세요.

이상 탐지 모델을 생성한 방식과 유사하게 지표 수학 표현식을 기반으로 이상 탐지 모델을 생성할 수 있습니다. CloudWatch 콘솔에서 이상 탐지를 지표 수학 표현식에 적용해 이상 탐지를 이러한 표현식의 임계값 유형으로 선택할 수 있습니다.

참고

지표 수학에 대한 이상 탐지는 최신 버전의 지표 사용자 인터페이스에서만 활성화 및 편집할 수 있습니다. 새 버전의 인터페이스에서 지표 수학 표현식을 기반으로 이상 탐지기를 만드는 경우 이전 버전에서 이상 탐지기를 볼 수는 있지만 편집할 수는 없습니다.

이상 탐지 및 지표 수학에 대한 경보 및 모델을 만드는 방법에 대한 자세한 내용은 다음 섹션을 참조하세요.

PutAnomalyDetector, DeleteAnomalyDetector, DescribeAnomalyDetectors와 함께 CloudWatch API를 사용하여 지표 수학 표현식을 기반으로 이상 탐지 모델을 생성, 삭제 및 검색할 수도 있습니다. 이러한 API 작업에 대한 자세한 내용은 Amazon CloudWatch API 참조의 다음 섹션을 참조하세요.

이상 탐지 경보의 요금이 책정되는 방법에 대한 자세한 내용은 Amazon CloudWatch 요금을 참조하세요.