RCF의 정의 및 수행하는 작업 - 아마존 QuickSight

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

RCF의 정의 및 수행하는 작업

Random Cut Forest(RCF)는 기계 학습에서 널리 사용되고 성공적인 기술인 random forest(RF) 알고리즘의 특수 유형입니다. 데이터 포인트 집합을 임의로 가져와서 동일한 수의 포인트로 축소한 다음 모델 모음을 빌드합니다. 반면에 모델이 결정 트리에 해당하므로 이름이 포리스트입니다. RF를 증분식으로 쉽게 업데이트할 수 없으므로 RCF는 증분식 업데이트가 가능하도록 설계된 트리 구조에서 변수를 사용하여 고안되었습니다.

비지도 알고리즘인 RCF는 클러스터 분석을 사용하여 시계열 데이터의 스파이크, 주기성 또는 계절성의 중단, 데이터 포인트 예외를 탐지합니다. Random cut forest는 동적 데이터 스트림의 개요 또는 스케치(또는 숫자의 타임 인덱스 시퀀스)로 작동할 수 있습니다. 스트림에 대한 질문과 대답은 개요를 기반으로 합니다. 다음은 이상 감지 및 예측에 연결하는 방법과 스트림을 설명하는 특성입니다.

  • 스트리밍 알고리즘은 적은 메모리 공간을 차지하는 온라인 알고리즘입니다. 온라인 알고리즘은 (t+1)-st 지점을 보기 전에 시간 t로 인덱싱된 입력 지점을 결정합니다. 작은 메모리는 낮은 지연 시간으로 응답을 생성하고 사용자가 데이터와 상호 작용할 수 있는 민첩한 알고리즘을 허용합니다.

  • 이상 탐지 및 예상에는 온라인 알고리즘처럼 시간 기준으로 부여된 순서를 고려해야 합니다. 모레에 무슨 일이 일어날지 이미 알고 있다면 내일 일어날 일을 예측하는 것은 예측이 아닙니다. 단지 알 수 없는 누락값을 보간하는 것뿐입니다. 마찬가지로, 오늘 소개된 신규 제품이 이상일 수 있지만 다음 분기가 끝날 때 반드시 이상을 유지할 필요는 없습니다.