RCF 是什麼及其用途 - Amazon QuickSight

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

RCF 是什麼及其用途

隨機切割森林 (RCF) 是一種特殊類型的隨機森林 (RF) 演算法,是機器學習中廣泛採用的成功技巧。它需要一組隨機資料點、切削成相同數量的點,然後建立一組模型。反之,模型對應到決策樹,所以稱為森林。由於 RF 無法以遞增方式輕鬆更新,因此在樹狀建構中以變數發明 RCF,目的是允許遞增更新。

RCF 為非監督演算法,使用叢集分析來偵測時間序列資料的峰值、週期性或季節性中斷,以及資料點例外。隨機切割森林可以做為動態資料串流 (或以時間編製索引的數字序列) 的概要或草圖運作。對於串流的問題,該概要可以回答。以下特點解釋串流及我們如何銜接到異常偵測和預測:

  • 串流演算法是佔用較少記憶體的線上演算法。在線上演算法看見第 (t+1)- 個點之前,會對依時間 t 編製索引的輸入點制定決策。佔用較少的記憶體時,靈活的演算法即能在低延遲下產生解答,並讓使用者與資料互動。

  • 在異常偵測和預測中,必須如同在線上演算法中,顧及時間加諸的順序。如果我們已經知道大後天將會發生什麼情況,那麼預測明天會發生什麼情況就不算是預測,而就只是插補未知的遺漏值。同樣地,今天推出的新產品可以是異常,但在下一季結束時不必然是異常。