이상 또는 특이값 탐지에 대한 개념 - 아마존 QuickSight

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

이상 또는 특이값 탐지에 대한 개념

QuickSight Amazon은 전체 분포 패턴을 벗어나는 데이터 요소를 설명하기 위해 예외라는 단어를 사용합니다. 특이값, 편차, 특이성, 예외, 불규칙성, 특징 등 과학적 용어인 이상에 대한 다른 단어가 많이 있습니다. 사용하는 용어는 수행하는 분석 유형, 사용하는 데이터 유형 또는 그룹의 기본 설정에 따라 달라질 수 있습니다. 이러한 외부 데이터 포인트는 사람, 장소, 사물 또는 시간과 같은 개체를 나타내며 어떤 면에서는 예외적입니다.

인간은 쉽게 패턴을 인식하고 서로 다른 것을 발견합니다. 인간의 감각은 이 정보를 제공합니다. 패턴이 단순하고 약간의 데이터만 있는 경우 그래프를 만들어 데이터에서 특이값을 강조할 수 있습니다. 몇 가지 간단한 예는 다음과 같습니다.

  • 파란색 풍선으로 구성된 그룹의 빨간 풍선

  • 다른 경주마보다 훨씬 앞서 있는 경주마

  • 수업 중에 주의를 집중하지 않는 아이

  • 온라인 주문이 증가하지만 배송이 저하된 날

  • 다른 사람들은 회복되지 않은 상태에서 회복된 사람

일부 데이터 포인트는 중요한 이벤트를 나타내고 다른 데이터 포인트는 임의로 발생을 나타냅니다. 분석은 이벤트에 기여한 구동 요인(주요 동인)에 따라 조사할 가치가 있는 데이터를 파악합니다. 질문은 데이터 분석에 필수적입니다. 발생한 이유는 무엇입니까? 무엇과 관련이 있습니까? 한번 또는 여러 번 발생했습니까? 권장하거나 권장하지 않기 위해 무엇을 할 수 있습니까?

변형이 존재하는 방법과 이유 및 변형에 패턴이 있는지 여부를 이해하려면 더 많은 생각이 필요합니다. 기계 학습의 지원 없이는 사람마다 다른 경험과 정보를 가지고 있기 때문에 다른 결론을 내릴 수 있습니다. 따라서 사람마다 약간 다른 비즈니스 결정을 내릴 수 있습니다. 고려해야 할 데이터나 변수가 많으면 엄청난 양의 분석이 필요할 수 있습니다.

ML 기반 이상 탐지는 데이터 중심의 의사 결정을 내릴 수 있도록 인과 관계 및 상관 관계를 식별합니다. 작업에서 데이터를 사용하는 방식을 정의할 수 있습니다. 고유한 파라미터를 지정하고 기여도 분석에서 주요 동인을 식별하는 등의 추가 옵션을 선택할 수 있습니다. 또는 기본 설정을 사용할 수도 있습니다. 다음 섹션에서는 설정 프로세스를 안내하고 사용 가능한 옵션에 대한 설명을 제공합니다.