O que é o RCF e o que ele faz - Amazon QuickSight

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

O que é o RCF e o que ele faz

Uma floresta de corte aleatório (RCF, Random Cut Forest) é um tipo especial do algoritmo floresta aleatória (RF, Random Forest), uma técnica amplamente usada e bem-sucedida de Machine Learning. Ela utiliza um conjunto de pontos de dados aleatórios, corta-os até o mesmo número de pontos e cria uma coleção de modelos. Em contrapartida, um modelo corresponde a uma árvore de decisão, por isso o nome de floresta. Como os RFs não podem ser facilmente atualizados de forma incremental, foram criados com variáveis na construção de árvores que foram feitas para permitir atualizações incrementais.

Como um algoritmo não supervisionado, o RCF usa análise de cluster para detectar picos nos dados de séries temporais, pausas na periodicidade ou sazonalidade e exceções nos pontos de dados. Os algoritmos RCF podem funcionar como a sinopse ou o esboço de um streaming de dados dinâmico (ou uma sequência de números indexada por tempo). As respostas às nossas perguntas sobre o streaming resultam da sinopse. As seguintes características abordam o streaming e como fazemos conexões com a detecção de anomalias e a previsão:

  • Um algoritmo de streaming é um algoritmo online com um pequeno espaço na memória. Um algoritmo online toma uma decisão sobre o ponto de entrada indexado por tempo t antes de ver o ponto de st (t+1). O pequeno espaço de memória permite algoritmos ágeis que podem produzir respostas com baixa latência e permitir que um usuário interaja com os dados.

  • Respeitar a ordem imposta pelo tempo, como em um algoritmo online, é necessário na previsão e na detecção de anomalias. Se já soubermos o que acontecerá depois de amanhã, prever o que acontecerá amanhã não será uma previsão, será apenas interpolar um valor ausente desconhecido. Da mesma forma, um novo produto lançado hoje pode ser uma anomalia, mas não necessariamente continuará sendo uma anomalia no final do próximo trimestre.