Cos'è RCF e come funziona - Amazon QuickSight

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Cos'è RCF e come funziona

Un random cut forest (RCF) è un tipo speciale di algoritmo random forest (RF), una tecnica largamente utilizzata nel machine learning. Utilizza un set di punti di dati casuali, li ridimensiona allo stesso numero di punti e in seguito crea una raccolta di modelli. Al contrario, un modello corrisponde a un albero decisionale, da cui il nome foresta. Poiché gli algoritmi RF non possono essere aggiornati facilmente in modo incrementale, gli algoritmi RCF sono stati inventati con variabili nella costruzione degli alberi che sono stati progettati per consentire gli aggiornamenti incrementali.

In qualità di algoritmo non controllato, RCF impiega cluster di analisi per rilevare picchi in dati di serie temporali, interruzioni nella periodicità o stagionalità ed eccezioni dei punti dati. Gli algoritmi random cut forest possono operare come sinossi o sketch di un flusso di dati dinamico (o una sequenza di numeri indicizzata temporalmente). Le risposte alle nostre domande sul flusso derivano da quella sinossi. Le seguenti caratteristiche affrontano il flusso e come eseguiamo connessioni al rilevamento e alla previsione di anomalie.

  • Un algoritmo di streaming è un algoritmo online con footprint della memoria ridotto. Un algoritmo online prende la decisione sul punto di input indicizzato dal tempo t prima di osservare il (t+1)-esimo punto. La memoria ridotta favorisce algoritmi agili che possono produrre risposte con bassa latenza e permettere a un utente di interagire con i dati.

  • Il rispetto dell'ordine imposto dal tempo, come in un algoritmo online, è necessario nel rilevamento delle anomalie e nelle previsioni. Se sappiamo già cosa accadrà dopodomani, allora prevedere cosa accadrà domani non è una previsione, ma solo l'interpolazione di un valore mancante sconosciuto. Analogamente, un nuovo prodotto introdotto oggi può essere un'anomalia, ma non necessariamente resterà tale alla fine del prossimo trimestre.