Qué es un RCF y cómo funciona - Amazon QuickSight

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Qué es un RCF y cómo funciona

Un bosque de corte aleatorio (RCF) es un tipo especial de algoritmo de bosque aleatorio (RF), una técnica que goza de amplia difusión en el machine learning. Este toma un conjunto de puntos de datos aleatorios, los reduce al mismo número de puntos y, a continuación, crea una colección de modelos. En contraste, un modelo corresponde a un árbol de decisiones, de ahí el nombre de bosque. Dado que los RF no se pueden actualizar fácilmente de manera incremental, los RCF se han creado con variables en la construcción del árbol diseñadas para permitir actualizaciones incrementales.

Como algoritmo no supervisado, el RCF utiliza el análisis del clúster para detectar picos en los datos de serie temporal, interrupciones en la periodicidad o estacionalidad y excepciones de puntos de datos. Los bosques de corte aleatorio pueden funcionar como una sinopsis o un boceto de un flujo de datos dinámico (o una secuencia de números indexados en el tiempo). Las respuestas a nuestras preguntas sobre el flujo proceden de dicha sinopsis. Las siguientes características se aplican al flujo y al modo en que efectuamos las conexiones para la previsión y la detección de anomalías:

  • Un algoritmo de streaming es un algoritmo online que ocupa poco en la memoria. Un algoritmo online toma su decisión sobre el punto de entrada indexado por el tiempo t antes de ver el punto (t+1)ésimo. El poco espacio en memoria permite algoritmos ágiles que pueden producir respuestas con baja latencia y permiten al usuario interactuar con los datos.

  • Respetar el orden impuesto por el tiempo, como en un algoritmo online, es necesario en la detección y previsión de anomalías. Si ya sabemos lo que sucederá pasado mañana, predecir lo que sucederá mañana no es un previsión, tan solo es una interpolación de un valor desconocido que falta. Del mismo modo, un nuevo producto presentado hoy puede ser una anomalía, pero no necesariamente lo seguirá siendo al final del próximo trimestre.