Rilevamento di anomalie in Amazon OpenSearch di Amazon OpenSearch

Il rilevamento delle anomalie nel OpenSearch servizio OpenSearch di Amazon rileva automaticamente le anomalie nei OpenSearch dati OpenSearch quasi in tempo reale grazie all'algoritmo Random Cut Forest (RCF). L'RCF è un algoritmo di machine learning non supervisionato che modella un disegno del flusso di dati in ingresso. L'algoritmo calcola un anomaly grade e un valore confidence score per ogni punto di dati in ingresso. Il rilevamento delle anomalie utilizza questi valori per differenziare un'anomalia dalle normali variazioni dei dati.

È possibile associare il rilevamento delle anomalie con l'avviso per essere certi di ricevere una notifica non appena viene rilevata un'anomalia.

Il rilevamento delle anomalie supporta il controllo granulare degli accessi solo su Elasticsearch OpenSearch versioni successive. Tutti i tipi di istanza, tranne t2.micro e t2.small, supportano il rilevamento delle anomalie.

Nota

Questa documentazione fornisce una breve panoramica del rilevamento delle anomalie nel contesto di Amazon OpenSearch Service. Per una documentazione completa, che include passaggi dettagliati, un riferimento all'API, un riferimento a tutte le impostazioni disponibili e i passaggi per creare visualizzazioni e dashboard, consulta il rilevamento delle anomalie nella documentazione open source. OpenSearch

Prerequisiti

Il rilevamento delle anomalie ha i seguenti requisiti preliminari:

Il rilevamento delle anomalie richiede OpenSearch OpenSearch o Elasticsearch 7.4 o versioni successive.
Il rilevamento delle anomalie supporta il controllo granulare degli accessi solo su Elasticsearch versioni 7.9 e successive e su tutte le versioni di OpenSearch. OpenSearch Prima di Elasticsearch 7.9, solo gli utenti amministratori potevano creare, visualizzare e gestire i rilevatori.
Se il dominio utilizza il controllo granulare degli accessi, gli utenti senza privilegi di amministratore devono essere mappati al anomaly_read_access ruolo anomaly_read_read_access in modo da visualizzare i OpenSearch rilevatori o anomaly_full_access anomaly_read_access per creare e gestire i rilevatori.

Nozioni di base sul rilevamento di anomalie

Per iniziare, scegliere Rilevamento di anomalie in OpenSearch OpenSearch Dashboards.

Fase 1: Creazione di un rilevatore

Un rivelatore è un'attività individuale di rilevamento delle anomalie. È possibile creare più rilevatori, e tutti possono essere eseguiti simultaneamente. Ogni rilevatore analizza i dati provenienti da origini diverse.

Fase 2: Aggiunta di caratteristiche al rilevatore

Una caratteristica è il campo nell'indice che viene controllato per la presenza di anomalie. Un rilevatore può rilevare anomalie in una o più caratteristiche. È necessario scegliere una delle seguenti aggregazioni per ogni funzionalità: average(), sum(), count(), min() o max().

Nota

Il metodo di count() aggregazione () è disponibile solo in OpenSearch OpenSearch ed Elasticsearch 7.7 o versioni successive. Per Elasticsearch 7.4, utilizzare un'espressione personalizzata come la seguente:


{
  "aggregation_name": {
     "value_count": {
        "field": "field_name"
     }
  }
}

Il metodo di aggregazione determina ciò che costituisce un'anomalia. Ad esempio, se si sceglie min(), il rilevatore si concentra sulla ricerca di anomalie in base ai valori minimi della caratteristica. Se si sceglie average(), il rilevatore rileva anomalie in base ai valori medi della caratteristica. È possibile aggiungere un massimo di cinque caratteristiche per ogni rilevatore.

È possibile configurare le seguenti impostazioni facoltative (disponibili in Elasticsearch 7.7 e versioni successive):

Campo Categoria: categorizzare o suddividere i dati con una dimensione come indirizzo IP, ID prodotto, codice paese e così via.
Dimensione finestra: impostare il numero di intervalli di aggregazione dal flusso dei dati da considerare in una finestra di rilevamento.

Dopo aver configurato le funzioni, visualizzare in anteprima le anomalie dei campioni e, se necessario, regolare le impostazioni delle funzioni.

Fase 3: Osservazione dei risultati

Nel pannello di controllo di rilevamento delle anomalie sono disponibili le seguenti visualizzazioni:

Anomalie in tempo reale visualizza i risultati delle anomalie in tempo reale per gli ultimi 60 intervalli. Ad esempio, se l'intervallo è impostato su 10, vengono visualizzati i risultati degli ultimi 600 minuti. Questo grafico viene aggiornato ogni 30 secondi.
Cronologia delle anomalie traccia il grado di anomalia con il corrispondente livello di attendibilità.
Il grafico Suddivisione delle caratteristiche traccia le caratteristiche in base al metodo di aggregazione. È possibile variare l'intervallo di data-ora del rilevatore.
Occorrenze delle anomalie mostra Start time, End time, Data confidence e Anomaly grade per ogni anomalia rilevata.

Se si imposta il campo della categoria, viene visualizzato una ulteriore mappa di calore che correla i risultati per le entità anomale. Scegliere un rettangolo pieno per visualizzare una vista più dettagliata dell'anomalia.

Fase 4: Configurazione degli avvisi

Per creare un monitoraggio per inviare notifiche quando vengono rilevate anomalie, scegliere Configura avvisi. Il plug-in reindirizza alla pagina Aggiungi monitor dove è possibile configurare un avviso.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Avviso

Tutorial: Rileva un elevato utilizzo della CPU con il rilevamento delle anomalie