RCF の概要と仕組み - Amazon QuickSight

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

RCF の概要と仕組み

Random Cut Forest (RCF) とは、Random Forest (RF) アルゴリズムの特殊タイプで、機械学習で広く使用され成功している手法です。この手法では、ランダムなデータポイントのセットを取り、それらを同じポイント数に切り下げて、その後モデルのコレクションを構築します。対照的に、モデルはデシジョンツリー (フォレスト) に対応します。RF は簡単に増分方式で更新することができないため、増分更新が可能になるよう設計されたツリー構造の変数で RCF が考案されました。

管理されないアルゴリズムである RCF は、クラスター分析を使用して時系列データのスパイク、周期性または季節性の中断、データポイントの例外を検出します。ランダムカットフォレストは、動的データストリームの概要またはスケッチ (またはタイムインデックス付きの数字シーケンス) として機能します。ストリームに関する質問の答えは、この概要から得られます。次の特性は、ストリームと、異常検出と予測への接続方法を示しています。

  • ストリーミングアルゴリズムは、メモリ使用量が少ないオンラインのアルゴリズムです。オンラインアルゴリズムは、 (t+1)-st ポイントを表示する前に時間 t によりインデックスが付けられた入力ポイントについて決定を下します。小さなメモリは、短い待ち時間で答えを生み出すことができ、ユーザーがデータと対話することを可能にする機敏なアルゴリズムを可能にします。

  • 時間による順序付けを尊重することは、オンラインアルゴリズムのように、異常の検出と予測に必要です。明後日に何が起こるかをすでに知っているなら、明日、何が起こるかを予測することは予測ではありません。未知の欠損値を補間するだけです。同様に、本日発表された新製品は異常である可能性がありますが、次の四半期末には必ずしも異常のままではありません。