Concetti per il rilevamento di anomalie o outlier - Amazon QuickSight

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Concetti per il rilevamento di anomalie o outlier

Amazon QuickSight usa il termine anomalia per descrivere punti dati che non rientrano in un modello di distribuzione generale. Ci sono molte altre parole per le anomalie, che è un termine scientifico, tra cui outlier, deviazioni, stranezze, eccezioni, irregolarità, bizzarrie e molti altri. Il termine utilizzato potrebbe essere basato sul tipo di analisi eseguita o sul tipo di dati utilizzati o anche solo sulla preferenza del gruppo. Questi punti dati periferici rappresentano un'entità, una persona, un luogo, una cosa o un tempo, che è in qualche modo eccezionale.

Gli esseri umani riconoscono facilmente gli schemi e notano cose che non sono come le altre. I nostri sensi ci forniscono queste informazioni. Se il modello è semplice e ci sono solo pochi dati, puoi facilmente creare un grafico per evidenziare gli outlier nei dati. Alcuni semplici esempi includono quanto segue:

  • Un palloncino rosso in un gruppo di palloncini blu

  • Un cavallo da corsa che è molto più avanti rispetto agli altri

  • Un bambino che è distratto durante la lezione

  • Un giorno in cui gli ordini online sono in aumento, ma le spedizioni sono in calo

  • Una persona che si è rimessa, mentre altre no

Alcuni punti dati rappresentano un evento significativo e altri rappresentano un'occorrenza casuale. L'analisi scopre su quali dati vale la pena indagare, in base a quali fattori determinanti (fattori chiave) hanno contribuito all'evento. Le domande sono fondamentali per l'analisi dei dati. Perché è accaduto? A cosa si riferisce? È accaduto una sola volta o più volte? Cosa puoi fare per incoraggiare o scoraggiare questi tipo di situazioni?

Capire come e perché esiste una variazione, e se c'è un modello nelle variazioni, richiede più riflessione. Senza l'assistenza del machine learning, ognuno potrebbe giungere a una conclusione diversa, perché ha esperienza e informazioni diverse. Pertanto, ognuno potrebbe prendere una decisione aziendale leggermente diversa. Se ci sono molti dati o variabili da considerare, ciò può richiedere una enorme quantità di analisi.

Il rilevamento delle anomalie con tecnologia Machine Learning identifica le cause e le correlazioni per consentire di prendere decisioni basate sui dati. Hai ancora il controllo sulla definizione del modo in cui vuoi che l'attività operi sui dati. È possibile specificare i propri parametri e scegliere opzioni aggiuntive, ad esempio l'identificazione dei fattori chiave in un'analisi dei fattori determinanti. Oppure è possibile utilizzare le impostazioni predefinite per entrambi. La sezione seguente illustra il processo di configurazione e fornisce spiegazioni per le opzioni disponibili.