ML 기반 이상 탐지 및 기여도 분석을 통해 특이값 및 주요 동인 탐색 - 아마존 QuickSight

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

ML 기반 이상 탐지 및 기여도 분석을 통해 특이값 및 주요 동인 탐색

분석에서 기여자(주요 동인)와 함께 이상(특이값이라고도 함)을 대화식으로 탐색할 수 있습니다. 탐색하는 데 사용할 수 있는 분석은 ML 기반 이상 탐지가 실행된 후에 사용할 수 있습니다. 이 화면에서 변경한 내용은 분석으로 돌아갈 때 저장되지 않습니다.

시작하려면 인사이트에서 이상 탐지를 선택하십시오. 다음 스크린샷은 처음 열었을 때 나타나는 이상 항목 화면을 보여줍니다. 이 예시에서는 기여자 분석을 설정하여 두 가지 주요 동인을 보여줍니다.

기여자를 포함한 이상 분석이 표시됩니다.

화면 섹션에는 왼쪽 상단에서 오른쪽 하단으로 다음 사항이 포함됩니다.

  • 기여자는 주요 동인을 표시합니다. 이 섹션을 보려면 이상 구성에서 기여자를 설정해야 합니다.

  • 컨트롤에는 이상 탐지를 위한 설정이 포함되어 있습니다.

  • 이상 수에는 시간이 지남에 따라 감지된 특이값이 표시됩니다. 이 차트 섹션을 숨기거나 표시할 수 있습니다.

  • 범주 또는 측정기준 필드의 필드 이름은 각 범주 또는 측정기준에 대한 이상을 표시하는 차트의 제목 역할을 합니다.

다음 단원에서는 이상 탐색의 각 측면에 대한 자세한 정보를 제공합니다.

기여자 탐색(주요 동인)

예외 항목 인사이트가 주요 동인을 탐지하도록 설정된 경우, 기여도 분석을 QuickSight 실행하여 이상치에 영향을 미치는 범주 (차원) 를 확인합니다. 기여자 섹션은 왼쪽에 표시됩니다.

기여자 패널.

기여자는 다음 섹션을 포함합니다:

  • 서술 - 왼쪽 상단에 지표의 변경 사항이 요약되어 있습니다.

  • 상위 기여자 구성 - 구성을 선택하여 이 섹션에서 사용할 기여자 및 날짜 범위를 변경합니다.

  • 정렬 기준 - 아래 표시된 결과에 표시되는 정렬을 설정합니다. 사용자는 다음 중에서 선택할 수 있습니다.

    • 절대 차이

    • 영향 비율 (기본값)

    • 예상과의 편차

    • 비율 차이

  • 상위 기여자 결과 - 오른쪽 타임라인에서 선택한 특정 시점에 대한 상위 기여자 분석 결과를 표시합니다.

    기여도 분석에서는 이상의 최상위 기여 요인 또는 주요 동인 중 최대 4개까지 식별합니다. 예를 들어 Amazon은 미국 내 건강 제품 판매량 급증에 기여한 상위 고객을 표시할 QuickSight 수 있습니다. 이 패널은 이상을 구성할 때 기여도 분석에 포함할 필드를 선택한 경우에만 나타납니다.

    이 패널이 표시되지 않지만 표시하려는 경우 활성화할 수 있습니다. 이렇게 하려면 분석으로 돌아가서 인사이트 메뉴에서 이상 구성을 선택하고 기여도를 분석할 필드를 최대 4개까지 선택합니다. 기여 동인을 제외하는 시트 컨트롤을 변경하면 기여도 패널이 닫힙니다.

이상 탐지를 위한 제어 설정

화면의 컨트롤 섹션에서 이상 탐지에 대한 설정을 찾을 수 있습니다. 컨트롤이라는 단어를 클릭하여 이 섹션을 열고 닫을 수 있습니다.

컨트롤을 선택하여 컨트롤 섹션을 엽니다.

설정에는 다음이 포함됩니다.

  • 컨트롤 - 현재 설정이 작업 영역 상단에 표시됩니다. 오른쪽에 있는 이중 화살표 아이콘을 선택하여 이 섹션을 확장할 수 있습니다. 다음 설정은 ML 기반 이상 탐지에 의해 생성된 특이값을 탐색하는 데 사용할 수 있습니다.

    • 심각도 - 탐지된 이상(특이값)에 대한 탐지기의 민감도를 설정합니다. 임계값이 낮음 이상으로 설정되면 볼 수 있는 이상이 더 많고 높음 이상으로 설정되면 볼 수 있는 이상이 더 적을 것으로 예상해야 합니다. 이 민감도는 RCF 알고리즘에 의해 생성된 이상 점수의 표준 편차에 따라 결정됩니다. 기본값은 보통 이상입니다.

    • 방향 - 이상으로 식별하려는 x축 또는 y축의 방향입니다. 기본값은 [모두]입니다. 다음을 선택할 수 있습니다.

      • 높은 값을 이상으로 식별하려면 예상보다 높음으로 설정하십시오.

      • 낮은 값을 이상으로 식별하려면 예상보다 낮음으로 설정합니다.

      • [모두]로 설정하면 높음과 낮음의 모든 변칙 값을 식별할 수 있습니다.

    • 최소 Delta - 절대값 — 이상 식별을 위한 절대 임계값으로 사용할 사용자 지정 값을 입력합니다. 이 값보다 높은 값은 이상으로 계산됩니다.

    • 최소 Delta - 백분율 - 이상 식별을 위한 백분율 임계값으로 사용할 사용자 지정 값을 입력합니다. 이 값보다 높은 값은 이상으로 계산됩니다.

    • 정렬 기준 - 이상 정렬에 적용할 방법을 선택합니다. 화면에 선호 순서대로 나열됩니다. 각 방법에 대한 설명은 다음 목록을 참조하십시오.

      • 가중 이상 점수 - 이상 점수에 실제 값과 예상 값 간 차이의 절대값에 대한 로그를 곱한 값입니다. 이 점수는 항상 양수입니다.

      • 이상 점수 - 이 데이터 포인트에 할당된 실제 이상 점수입니다.

      • 예상 값과의 가중 차이 - (기본값)이상 점수에 실제 값과 예상 값 간 차이를 곱한 값입니다.

      • 예상 값과의 차이 - 실제 값과 예상 값 간의 실제 차이입니다(실제 값-예상 값).

      • 실제 값 - 공식이 적용되지 않은 실제 값입니다.

    • 카테고리 - 하나 이상의 설정이 다른 설정의 끝에 나타날 수 있습니다. 범주 필드에 잘 추가한 각 범주 필드에는 하나씩 있습니다. 카테고리 설정을 사용하여 화면에 표시되는 데이터를 제한할 수 있습니다.

날짜별 예외 항목 표시 및 숨기기

이상 수 차트는 시간 경과에 따라 감지된 이상치를 보여줍니다. 이 차트가 보이지 않는 경우 날짜별 이상 보기를 선택하여 차트를 표시할 수 있습니다.

이상 수 차트

이 차트는 시계열 내 가장 최근 데이터 포인트의 이상(특이값)을 보여줍니다. 확장하면 다음과 같은 구성 요소가 표시됩니다.

  • 이상 - 화면 중앙에는 시계열에서 가장 최근 데이터 포인트의 이상이 표시됩니다. 하나 이상의 그래프가 시간 경과에 따른 지표의 변화를 보여주는 차트와 함께 표시됩니다. 이 그래프를 사용하려면 타임라인을 따라 점을 선택합니다. 현재 선택된 시점이 그래프에서 강조 표시되고 현재 지표에 대한 영향 분석 옵션을 제공하는 메뉴가 포함됩니다. 특정 시점을 선택하지 않고 타임라인 상에 커서를 드래그하여 해당 시점의 지표 값을 표시할 수도 있습니다.

  • 날짜별 이상 - 날짜별 이상 표시를 선택하는 경우 각 시점에 있던 중요한 이상 수를 보여주는 또 다른 그래프가 표시됩니다. 각 막대의 컨텍스트 메뉴에서 이 차트의 세부 정보를 확인할 수 있습니다.

  • 타임라인 조정 - 각 그래프에는 날짜 아래의 타임라인 조정 도구가 있습니다. 이 도구를 사용하여 압축하거나 확장하거나 볼 기간을 선택할 수 있습니다.

범주 또는 차원별 예외 항목 탐색

이상 탐색 화면의 기본 섹션은 화면 오른쪽 아래에 잠겨 있습니다. 화면의 다른 섹션이 몇 개나 열려 있더라도 이 화면은 그대로 남아 있습니다. 이상이 여러 개 있는 경우 아래로 스크롤하여 강조 표시할 수 있습니다. 차트는 색상 범위의 이상을 표시하고 일정 기간 동안 이러한 이상이 발생하는 위치를 보여줍니다.

이상 화면을 탐색합니다.

각 카테고리 또는 측정 기준에는 필드 이름을 차트 제목으로 사용하는 별도의 차트가 있습니다. 각 차트는 다음 구성 요소를 포함합니다.

  • 경고 구성 - 대시보드에서 이상을 탐색하는 경우 이 버튼을 선택하여 경고 및 기여도 분석(구성된 경우)을 구독합니다. 심각도 수준(보통, 높음 등)에 대한 경고를 설정할 수 있습니다. 예상보다 높음, 예상보다 낮음 또는 모두에 대해 상위 5개 경고를 받을 수 있습니다. 대시보드 리더는 스스로 경고를 구성할 수 있습니다. 분석에서 이상 탐색 페이지를 열면 해당 페이지에 이 단추가 표시되지 않습니다.

    참고

    경고를 구성하는 기능은 게시된 대시보드에서만 사용할 수 있습니다.

  • 통계 - 이상 제목 아래에 있는 상태 섹션에는 마지막 실행에 대한 정보가 표시됩니다. 예를 들어 '2018년 11월 17일 수익의 이상'이 표시될 수 있습니다. 이 레이블은 처리된 지표 수 및 얼마나 오래 전에 처리되었는지 알려줍니다. 링크를 선택하여 세부 정보(예: 무시된 지표 수)에 대해 자세히 알아볼 수 있습니다.