Monitoraggio delle metriche dei OpenSearch cluster con Amazon CloudWatch - OpenSearch Servizio Amazon

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Monitoraggio delle metriche dei OpenSearch cluster con Amazon CloudWatch

Amazon OpenSearch Service pubblica i dati dei tuoi domini su Amazon. CloudWatch CloudWatch ti consente di recuperare le statistiche su tali punti dati sotto forma di un insieme ordinato di dati di serie temporali, noti come metriche. OpenSearch Il servizio invia la maggior parte delle metriche a CloudWatch intervalli di 60 secondi. Se utilizzi EBS volumi General Purpose o Magnetic, le metriche del EBS volume si aggiornano solo ogni cinque minuti. Tutte le metriche cumulative (ad esempioThreadpoolSearchRejected) sono in memoria ThreadpoolWriteRejected e perderanno lo stato. Le metriche verranno reimpostate durante la caduta di un nodo, il rimbalzo del nodo, la sostituzione del nodo e la distribuzione blu/verde. Per ulteriori informazioni su Amazon CloudWatch, consulta la Amazon CloudWatch User Guide.

La console OpenSearch di servizio mostra una serie di grafici basati sui dati grezzi di CloudWatch. A seconda delle esigenze, potresti preferire visualizzare i dati del cluster CloudWatch anziché i grafici nella console. Il servizio archivia i parametri per due settimane prima di eliminarli. Le metriche vengono fornite senza costi aggiuntivi, ma sono CloudWatch comunque a pagamento per la creazione di dashboard e allarmi. Per ulteriori informazioni, consulta i CloudWatchprezzi di Amazon.

OpenSearch Il servizio pubblica le seguenti metriche su: CloudWatch

Visualizzazione delle metriche in CloudWatch

CloudWatch le metriche vengono raggruppate prima in base allo spazio dei nomi del servizio e quindi in base alle varie combinazioni di dimensioni all'interno di ogni spazio dei nomi.

Per visualizzare le metriche utilizzando la console CloudWatch
  1. Apri la CloudWatch console all'indirizzo https://console.aws.amazon.com/cloudwatch/.

  2. Nel pannello di navigazione a sinistra, scegli Metrics (Parametri), quindi scegli All metrics (Tutti i parametri). Seleziona lo spazio dei OpenSearchService nomi ES/.

  3. Scegliere una dimensione per visualizzare i parametri corrispondenti. I parametri per i singoli nodi si trovano nella dimensione ClientId, DomainName, NodeId. I parametri del cluster si trovano nella dimensione Per-Domain, Per-Client Metrics. Alcuni parametri dei nodi vengono aggregati a livello di cluster e quindi inclusi in entrambe le dimensioni. I parametri delle partizioni si trovano nella dimensione ClientId, DomainName, NodeId, ShardRole.

Per visualizzare un elenco di metriche utilizzando il AWS CLI

Esegui il comando seguente:

aws cloudwatch list-metrics --namespace "AWS/ES"

Interpretazione delle cartelle cliniche in Service OpenSearch

Per visualizzare le metriche in OpenSearch Service, utilizza le schede Cluster Health e Instance Health. La scheda Instance Health utilizza diagrammi a riquadri per fornire at-a-glance visibilità sullo stato di ogni OpenSearch nodo:

Chart showing search rate and CPU utilization for different instances with varying percentages.
  • Ogni casella colorata mostra l'intervallo di valori per il nodo nel periodo di tempo specificato.

  • Le caselle blu rappresentano i valori che sono compatibili con gli altri nodi. Le caselle rosse rappresentano i valori erratici.

  • La linea bianca all'interno di ogni casella mostra il valore corrente del nodo.

  • Le "parentesi angolari" su entrambi i lati di ciascuna casella mostrano i valori minimo e massimo per tutti i nodi nel periodo di tempo.

Se si apportano modifiche alla configurazione del dominio, l'elenco delle singole istanze nelle schede Cluster health (Stato cluster) e Instance health (Stato istanza) raddoppierà spesso in dimensione per un breve periodo prima di tornare al numero corretto. Per una spiegazione del comportamento, consulta Apportare modifiche alla configurazione in Amazon OpenSearch Service.

Parametri cluster

Amazon OpenSearch Service fornisce le seguenti metriche per i cluster.

Parametro Descrizione
ClusterStatus.green

Un valore pari a 1 indica che tutte le partizioni di indice sono assegnate a nodi nel cluster.

Statistiche rilevanti: Massima

ClusterStatus.yellow Un valore pari a 1 indica che le partizioni principali per tutti gli indici sono allocate a nodi nel cluster, ma che le partizioni di replica per almeno un indice non lo sono. Per ulteriori informazioni, consulta Stato giallo del cluster.

Statistiche rilevanti: Massima

ClusterStatus.red

Un valore pari a 1 indica che le partizioni primarie e di replica di almeno un indice non sono allocate ai nodi nel cluster. Per ulteriori informazioni, consultare Cluster in stato rosso.

Statistiche rilevanti: Massima

Shards.active

Il numero totale di partizioni primarie e di replica attive.

Statistiche rilevanti: Massima, Somma

Shards.unassigned

Il numero di partizioni non allocate ai nodi nel cluster.

Statistiche rilevanti: Massima, Somma

Shards.delayedUnassigned

Il numero di partizioni la cui allocazione dei nodi è stata ritardata dalle impostazioni di timeout.

Statistiche rilevanti: Massima, Somma

Shards.activePrimary

Il numero di partizioni primarie attive.

Statistiche rilevanti: Massima, Somma

Shards.initializing

Il numero di partizioni in fase di inizializzazione.

Statistiche rilevanti: Sum (Somma)

Shards.relocating

Il numero di partizioni in fase di rilocazione.

Statistiche rilevanti: Sum (Somma)

Nodes

Il numero di nodi nel cluster di OpenSearch servizio, inclusi nodi master e UltraWarm nodi dedicati. Per ulteriori informazioni, consulta Apportare modifiche alla configurazione in Amazon OpenSearch Service.

Statistiche rilevanti: Massima

SearchableDocuments

Il numero totale di documenti disponibili per la ricerca tra tutti i nodi di dati nel cluster.

Statistiche rilevanti: Minima, Massima, Media

DeletedDocuments

Il numero totale di documenti contrassegnati per l'eliminazione tra tutti i nodi di dati nel cluster. Questi documenti non vengono più visualizzati nei risultati di ricerca, ma rimuovono dal disco OpenSearch solo i documenti eliminati durante l'unione dei segmenti. Questo parametro aumenta dopo le richieste di eliminazione e diminuisce dopo la fusione dei segmenti.

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

CPUUtilization

La percentuale di CPU utilizzo dei nodi di dati nel cluster. Massimo mostra il nodo con il massimo CPU utilizzo. La media rappresenta tutti i nodi del cluster. Questo parametro è disponibile anche per singoli nodi.

Statistiche rilevanti: Maximum (Massimo), Average (Media)

FreeStorageSpace

Lo spazio libero per i nodi di dati nel cluster. Sum mostra lo spazio libero totale per il cluster, ma è necessario lasciare il periodo a un minuto per ottenere un valore accurato. Minimum e Maximum mostrano i nodi con lo spazio libero maggiore e minore, rispettivamente. Questa metrica è disponibile anche per i singoli nodi. OpenSearch Il servizio genera un ClusterBlockException quando questa metrica raggiunge. 0 Per eseguire il ripristino, è necessario eliminare gli indici, aggiungere istanze più grandi o aggiungere storage EBS basato sulle istanze esistenti. Per ulteriori informazioni, consulta Mancanza di spazio di archiviazione disponibile.

La console OpenSearch di servizio visualizza questo valore in GiB. La CloudWatch console Amazon lo visualizza in MiB.

Nota

FreeStorageSpacesarà sempre inferiore ai valori _cat/allocation APIs forniti da OpenSearch _cluster/stats e. OpenSearch Il servizio riserva una percentuale dello spazio di archiviazione su ciascuna istanza per le operazioni interne. Per ulteriori informazioni, consultare Calcolo dei requisiti di archiviazione.

Statistiche rilevanti: Minimum (Minimo), Maximum (Massimo), Average (Media), Sum (Somma)

ClusterUsedSpace

Lo spazio totale utilizzato per il cluster. È necessario lasciare il periodo su un minuto per ottenere un valore preciso.

La console OpenSearch di servizio visualizza questo valore in GiB. La CloudWatch console Amazon lo visualizza in MiB.

Statistiche rilevanti: Minimum (Minimo), Maximum (Massimo)

ClusterIndexWritesBlocked

Indica se il cluster accetta o blocca le richieste di scrittura in entrata. Un valore pari a 0 significa che il cluster accetta le richieste. Un valore pari a 1 significa che il cluster blocca le richieste.

Alcuni fattori comuni sono i seguenti: FreeStorageSpace è troppo basso oppure JVMMemoryPressure è troppo alto. Per contenere questo problema, puoi decidere di aggiungere altro spazio su disco oppure di dimensionare il tuo cluster.

Statistiche rilevanti: Massima

JVMMemoryPressure

La percentuale massima dell'heap Java utilizzata per tutti i nodi di dati del cluster. OpenSearch Il servizio utilizza metà di un'istanza RAM per l'heap Java, fino a una dimensione dell'heap di 32 GiB. È possibile scalare le istanze verticalmente fino a 64 GiB diRAM, a quel punto è possibile scalare orizzontalmente aggiungendo istanze. Per informazioni, consulta CloudWatch Allarmi consigliati per Amazon Service OpenSearch .

Statistiche rilevanti: Massima

Nota

La logica di questo parametro è cambiata nel software del servizio R20220323. Per ulteriori informazioni, consulta le note di rilascio.

OldGenJVMMemoryPressure

La percentuale massima dell'heap Java utilizzata per la "vecchia generazione" di tutti i nodi di dati nel cluster. Questo parametro è disponibile anche a livello di nodo.

Statistiche rilevanti: Massima

AutomatedSnapshotFailure

Il numero di snapshot automatici non riusciti per il cluster. Un valore pari a 1 indica che non è stato acquisito alcuno snapshot automatico per il dominio nelle 36 ore precedenti.

Statistiche rilevanti: Minimum (Minimo), Maximum (Massimo)

CPUCreditBalance

I CPU crediti rimanenti disponibili per i nodi di dati del cluster. Un CPU credito fornisce le prestazioni di un CPU core completo per un minuto. Per ulteriori informazioni, consulta CPUi crediti nell'Amazon EC2 Developer Guide. Questo parametro è disponibile solo per i tipi di istanza T2.

Statistiche rilevanti: Minimum (Minimo)

OpenSearchDashboardsHealthyNodes

Un controllo dello stato di salute per OpenSearch Dashboards. Se il valore minimo, massimo e medio sono tutti uguali a 1, Dashboards si comporta normalmente. Se si dispone di 10 nodi con un massimo di 1, minimo di 0 e media di 0,7, allora significa che 7 nodi (70%) sono integri e 3 nodi (30%) non lo sono.

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

OpensearchDashboardsReportingFailedRequestSysErrCount

Il numero di richieste di generazione di report di OpenSearch Dashboard che non sono riuscite a causa di problemi del server o limitazioni delle funzionalità.

Statistiche rilevanti: Sum (Somma)

OpensearchDashboardsReportingFailedRequestUserErrCount

Il numero di richieste di generazione di report di OpenSearch Dashboards che non sono riuscite a causa di problemi del client.

Statistiche rilevanti: Sum (Somma)

OpensearchDashboardsReportingRequestCount

Il numero totale di richieste per generare OpenSearch report Dashboards.

Statistiche rilevanti: Sum (Somma)

OpensearchDashboardsReportingSuccessCount

Il numero di richieste riuscite per generare OpenSearch report Dashboards.

Statistiche rilevanti: Sum (Somma)

KMSKeyError

Un valore pari a 1 indica che AWS KMS la chiave utilizzata per crittografare i dati inattivi è stata disabilitata. Per ripristinare il dominio sulle operazioni normali, riabilita la chiave. La console visualizza questo parametro solo per i domini che crittografano i dati a riposo.

Statistiche rilevanti: Minimum (Minimo), Maximum (Massimo)

KMSKeyInaccessible

Un valore pari a 1 indica che AWS KMS la chiave utilizzata per crittografare i dati inattivi è stata eliminata o le relative concessioni al Servizio sono state revocate. OpenSearch Non è possibile recuperare i domini che sono in questo stato. Se hai una snapshot manuale, puoi utilizzarla per migrare i dati del dominio in un nuovo dominio. La console visualizza questo parametro solo per i domini che crittografano i dati a riposo.

Statistiche rilevanti: Minimum (Minimo), Maximum (Massimo)

InvalidHostHeaderRequests

Il numero di HTTP richieste effettuate al OpenSearch cluster che includevano un'intestazione host non valida (o mancante). Le richieste valide includono il nome host del dominio come valore dell'intestazione dell'host. OpenSearch Il servizio rifiuta le richieste non valide per i domini di accesso pubblico che non dispongono di una politica di accesso restrittiva. Si consiglia di applicare una policy di accesso restrittiva a tutti i domini.

Se vedi valori elevati per questa metrica, conferma che i tuoi OpenSearch clienti includano il nome host del dominio (e non, ad esempio, il relativo indirizzo IP) nelle loro richieste.

Statistiche rilevanti: Sum (Somma)

OpenSearchRequests (previously ElasticsearchRequests)

Il numero di richieste effettuate al OpenSearch cluster.

Statistiche rilevanti: Sum (Somma)

2xx, 3xx, 4xx, 5xx

Il numero di richieste al dominio che hanno prodotto il codice di HTTP risposta specificato (2 xx, 3 xx, 4 xx, 5 xx).

Statistiche rilevanti: Sum (Somma)

ThroughputThrottle

Indica se i dischi sono stati limitati o meno. La limitazione si verifica quando la velocità effettiva combinata di ReadThroughputMicroBursting e WriteThroughputMicroBursting è superiore alla velocità massima,. MaxProvisionedThroughput MaxProvisionedThroughputè il valore più basso del throughput dell'istanza o del throughput di volume assegnato. Il valore 1 indica che i dischi sono stati limitati. Un valore 0 indica un comportamento normale.

Per informazioni sulla velocità effettiva delle istanze, consulta Amazon EBS —optimized instances. Per informazioni sulla velocità effettiva dei volumi, consulta i tipi di EBS volume di Amazon.

Statistiche rilevanti: Minimum (Minimo), Maximum (Massimo)

IopsThrottle

Indica se il numero di operazioni di input/output al secondo (IOPS) sul dominio è stato limitato o meno. La limitazione si verifica quando un nodo IOPS di dati supera il limite massimo consentito del EBS volume o dell'istanza del nodo di dati. EC2

Per informazioni sull'istanzaIOPS, consulta Amazon EBS —optimized instances. Per informazioni sul volumeIOPS, consulta i tipi di EBS volume di Amazon.

Statistiche rilevanti: Minimum (Minimo), Maximum (Massimo)

HighSwapUsage

Il valore 1 indica che lo scambio dovuto a errori di pagina ha potenzialmente causato picchi nell'utilizzo del disco sottostante durante un periodo di tempo specifico.

Statistiche rilevanti: Massima

Parametri nodo master dedicato

Amazon OpenSearch Service fornisce le seguenti metriche per i nodi master dedicati.

Parametro Descrizione
MasterCPUUtilization

La percentuale massima di CPU risorse utilizzate dai nodi master dedicati. È consigliato aumentare le dimensioni del tipo di istanza quando questo parametro raggiunge 60%.

Statistiche rilevanti: Massima

MasterFreeStorageSpace

Questo parametro non è rilevante e può essere ignorato. Il servizio non utilizza i nodi master come nodi di dati.

MasterJVMMemoryPressure

La percentuale massima dell'heap di Java utilizzata per tutti i nodi master dedicati nel cluster. È consigliato passare a un tipo di istanza più grande quando questo parametro raggiunge 85%.

Statistiche rilevanti: Massima

Nota

La logica di questo parametro è cambiata nel software del servizio R20220323. Per ulteriori informazioni, consulta le note di rilascio.

MasterOldGenJVMMemoryPressure

La percentuale massima dell'heap Java utilizzata per la "vecchia generazione" per ciascun nodo principale.

Statistiche rilevanti: Massima

MasterCPUCreditBalance

I CPU crediti rimanenti disponibili per i nodi master dedicati nel cluster. Un CPU credito fornisce le prestazioni di un CPU core completo per un minuto. Per ulteriori informazioni, consulta CPUi crediti nell'Amazon EC2 Developer Guide. Questo parametro è disponibile solo per i tipi di istanza T2.

Statistiche rilevanti: Minimum (Minimo)

MasterReachableFromNode

Un controllo dello stato per le eccezioni MasterNotDiscovered. Un valore pari a 1 indica un comportamento normale. Un valore di pari a indica che /_cluster/health/ ha avuto esito negativo.

I guasti indicano che il nodo master non è raggiungibile dal nodo di origine. Di solito sono il risultato di un problema di connettività di rete o di un AWS problema di dipendenza.

Statistiche rilevanti: Massima

MasterSysMemoryUtilization

La percentuale di memoria del nodo master utilizzata.

Statistiche rilevanti: Massima

EBSmetriche di volume

Amazon OpenSearch Service fornisce le seguenti metriche per i EBS volumi.

Parametro Descrizione
ReadLatency

La latenza, in secondi, per le operazioni di lettura sui EBS volumi. Questo parametro è disponibile anche per singoli nodi.

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

WriteLatency

La latenza, in secondi, per le operazioni di scrittura sui EBS volumi. Questo parametro è disponibile anche per singoli nodi.

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

ReadThroughput

La velocità effettiva, in byte al secondo, per le operazioni di lettura sui volumi. EBS Questo parametro è disponibile anche per singoli nodi.

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

ReadThroughputMicroBursting

La velocità effettiva, in byte al secondo, per le operazioni di lettura sui EBS volumi quando si prende in considerazione il microbursting. Questo parametro è disponibile anche per singoli nodi. Il microbursting si verifica quando un EBS volume raggiunge livelli elevati IOPS o la produttività per periodi di tempo significativamente più brevi (meno di un minuto).

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

WriteThroughput

La velocità effettiva, in byte al secondo, per le operazioni di scrittura sui volumi. EBS Questo parametro è disponibile anche per singoli nodi.

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

WriteThroughputMicroBursting

La velocità effettiva, in byte al secondo, per le operazioni di scrittura sui EBS volumi quando si prende in considerazione il microbursting. Questo parametro è disponibile anche per singoli nodi. Il microbursting si verifica quando un EBS volume raggiunge livelli elevati IOPS o la velocità di trasmissione per periodi di tempo significativamente più brevi (meno di un minuto).

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

DiskQueueDepth

Il numero di richieste di input e output (I/O) in sospeso per un volume. EBS

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

ReadIOPS

Il numero di operazioni di input e output (I/O) al secondo per le operazioni di lettura sui volumi. EBS Questo parametro è disponibile anche per singoli nodi.

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

ReadIOPSMicroBursting

Il numero di operazioni di input e output (I/O) al secondo per le operazioni di lettura sui EBS volumi quando si prende in considerazione il microbursting. Questo parametro è disponibile anche per singoli nodi. Il microbursting si verifica quando un EBS volume raggiunge livelli elevati IOPS o la produttività per periodi di tempo significativamente più brevi (meno di un minuto).

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

WriteIOPS

Il numero di operazioni di input e output (I/O) al secondo per le operazioni di scrittura su volumi. EBS Questo parametro è disponibile anche per singoli nodi.

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

WriteIOPSMicroBursting

Il numero di operazioni di input e output (I/O) al secondo per le operazioni di scrittura sui EBS volumi quando si prende in considerazione il microbursting. Questo parametro è disponibile anche per singoli nodi. Il microbursting si verifica quando un EBS volume raggiunge livelli elevati IOPS o la produttività per periodi di tempo significativamente più brevi (meno di un minuto).

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

BurstBalance

La percentuale di crediti di input e output (I/O) rimanenti nel burst bucket di un volume. EBS Un valore pari a 100 indica che il volume ha accumulato il numero massimo di crediti. Se questa percentuale scende al di sotto del 70%, consulta Saldo di burst EBS basso. Il saldo di espansione rimane a 0 per i domini con tipi di volumi gp3 e i domini con volumi gp2 con una dimensione del volume superiore a 1.000 GiB.

Statistiche rilevanti: Minimum, Maximum, Average (Minimo, Massimo, Medio)

Parametri dell'istanza

Amazon OpenSearch Service fornisce le seguenti metriche per ogni istanza in un dominio. OpenSearch Il servizio aggrega inoltre questi parametri delle istanze per fornire informazioni sullo stato generale del cluster. È possibile verificare questo comportamento utilizzando la statistica Conteggio del campione nella console. Nota che ogni parametro nella tabella seguente dispone di statistiche rilevanti per il nodo e il cluster.

Importante

Diverse versioni di Elasticsearch utilizzano diversi pool di thread per elaborare le chiamate a. _index API Elasticsearch 1.5 e 2.3 utilizzano il pool di thread di indice. Elasticsearch 5. x, 6.0 e 6.2 utilizzano il pool di thread in blocco. OpenSearch e Elasticsearch 6.3 e versioni successive utilizzano il pool di thread di scrittura. Attualmente, la console OpenSearch di servizio non include un grafico per il pool di thread in blocco.

Utilizzare GET _cluster/settings?include_defaults=true per controllare le dimensioni del pool di thread e della coda per il cluster.

Parametro Descrizione
ConcurrentSearchRate

Il numero totale di richieste di ricerca che utilizzano la ricerca simultanea per segmenti al minuto per tutti gli shard su un nodo di dati. Una singola chiamata a _search API potrebbe restituire risultati da molti shard diversi. Se cinque di queste partizioni si trovano in un solo nodo, il nodo indicherà 5 per questo parametro, anche se il client ha effettuato una sola richiesta.

Statistiche di nodo rilevanti: Media

Statistiche del cluster rilevanti: Media, Massima, Somma

ConcurrentSearchLatency

La differenza nel tempo totale, in millisecondi, impiegato da tutte le ricerche che utilizzano la ricerca simultanea per segmenti in un nodo tra il minuto N e il minuto (N-1).

Statistiche di nodo rilevanti: Media

Statistiche del cluster rilevanti: Media, Massima

IndexingLatency

La differenza nel tempo totale, in millisecondi, rilevata da tutte le operazioni di indicizzazione in un nodo tra il minuto N e il minuto (N-1).

Statistiche di nodo rilevanti: Media

Statistiche del cluster rilevanti: Media, Massima

IndexingRate

Il numero di operazioni di indicizzazione al minuto. Una singola chiamata a _bulk API che aggiunge due documenti e ne aggiorna due conta come quattro operazioni, che potrebbero essere distribuite su uno o più nodi. Se tale indice ha una o più repliche e si trova in un OpenSearch dominio senza istanze ottimizzate, anche gli altri nodi del cluster registrano un totale di quattro operazioni di indicizzazione. Per i OpenSearch domini con istanze ottimizzate, gli altri nodi con repliche non registrano alcuna operazione. L'eliminazione di documenti non viene conteggiata ai fini di questo parametro.

Statistiche di nodo rilevanti: Media

Statistiche del cluster rilevanti: Media, Massima, Somma

SearchLatency

La differenza nel tempo totale, in millisecondi, rilevato da tutte le ricerche in un nodo tra il minuto N e il minuto (N-1).

Statistiche di nodo rilevanti: Media

Statistiche del cluster rilevanti: Media, Massima

SearchRate

Il numero totale di richieste di ricerca al minuto per tutte le partizioni in un nodo di dati. Una singola chiamata a _search API potrebbe restituire risultati da molti shard diversi. Se cinque di queste partizioni si trovano in un solo nodo, il nodo indicherà 5 per questo parametro, anche se il client ha effettuato una sola richiesta.

Statistiche di nodo rilevanti: Media

Statistiche del cluster rilevanti: Media, Massima, Somma

SegmentCount

Il numero di segmenti in un nodo di dati. Più segmenti hai, più tempo impiega ogni ricerca. OpenSearch occasionalmente unisce segmenti più piccoli in segmenti più grandi.

Statistiche nodo rilevanti: Massima, Media

Statistiche del cluster rilevanti: Somma, Massimo, Media

SysMemoryUtilization

La percentuale di memoria dell'istanza utilizzata. I valori elevati per questa metrica sono normali e in genere non rappresentano un problema con il cluster. Per un migliore indicatore dei potenziali problemi di prestazioni e stabilità, vedere la metrica JVMMemoryPressure.

Statistiche di nodo rilevanti: Minima, Massima, Media

Statistiche del cluster rilevanti: Minima, Massima, Media

JVMGCYoungCollectionCount

Il numero di volte in cui è stata eseguita la garbage collection di "nuova generazione". Un numero elevato e in continua crescita di esecuzioni è una parte normale delle operazioni del cluster.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

JVMGCYoungCollectionTime

La quantità di tempo, in millisecondi, che il cluster ha impiegato per eseguire la garbage collection di "nuova generazione".

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

JVMGCOldCollectionCount

Il numero di volte in cui è stata eseguita la garbage collection "vecchia generazione". In un cluster con risorse sufficienti, questo numero deve rimanere basso e senza frequenti incrementi.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

JVMGCOldCollectionTime

La quantità di tempo, in millisecondi, che il cluster ha impiegato per eseguire la garbage collection "vecchia generazione".

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

OpenSearchDashboardsConcurrentConnections

Il numero di connessioni simultanee attive alle dashboard. OpenSearch Se questo numero cresce costantemente, valutare la possibilità di dimensionare il cluster.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

OpenSearchDashboardsHealthyNode

Un controllo di integrità per il singolo nodo OpenSearch Dashboards. Un valore pari a 1 indica un comportamento normale. Un valore pari a 0 indica che Dashboards non è accessibile.

Statistiche nodo rilevanti: Minima

Statistiche del cluster rilevanti: Minima, Massima, Media

OpenSearchDashboardsHeapTotal

La quantità di memoria heap allocata alle OpenSearch dashboard in MiB. Diversi tipi di EC2 istanza possono influire sull'esatta allocazione della memoria.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

OpenSearchDashboardsHeapUsed

La quantità assoluta di memoria heap utilizzata dai OpenSearch dashboard in MiB.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

OpenSearchDashboardsHeapUtilization

La percentuale massima di memoria heap disponibile utilizzata dai dashboard. OpenSearch Se questo valore supera l'80%, valutare la possibilità di dimensionare il cluster.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Minima, Massima, Media

OpenSearchDashboardsOS1MinuteLoad

La media di CPU caricamento di un minuto per le dashboard. OpenSearch Il CPU carico dovrebbe idealmente rimanere al di sotto di 1,00. Mentre i picchi temporanei vanno bene, se questo parametro è costantemente superiore a 1 si consiglia di aumentare la dimensione del tipo di istanza.

Statistiche di nodo rilevanti: Media

Statistiche del cluster rilevanti: Media, Massima

OpenSearchDashboardsRequestTotal

Il numero totale di HTTP richieste inviate alle OpenSearch dashboard. Se il sistema è lento o viene visualizzato un numero elevato di richieste Dashboards, è consigliabile aumentare le dimensioni del tipo di istanza.

Statistiche del nodo rilevanti: Somma

Statistiche del cluster rilevanti: Somma

OpenSearchDashboardsResponseTimesMaxInMillis

Il tempo massimo, in millisecondi, impiegato dalle OpenSearch dashboard per rispondere a una richiesta. Se le richieste richiedono molto tempo per restituire i risultati, è consigliabile aumentare le dimensioni del tipo di istanza.

Statistiche di nodo rilevanti: Massima

Statistiche cluster rilevanti: Massima, Media

SearchTaskCancelled

Il numero di cancellazioni del nodo coordinatore.

Statistiche del nodo rilevanti: Somma

Statistiche del cluster rilevanti: Somma

SearchShardTaskCancelled

Il numero di cancellazioni dei nodi dati.

Statistiche del nodo rilevanti: Somma

Statistiche pertinenti sui cluster: somma,

ThreadpoolForce_mergeQueue

Il numero di attività in coda nel pool di thread forza unione. Se la dimensione della coda è costantemente elevata, valutare la possibilità di ridimensionare il cluster.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

ThreadpoolForce_mergeRejected

Il numero di attività rifiutate nel pool di thread forza unione. Se questo numero cresce costantemente, valutare la possibilità di ridimensionare il cluster.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma

ThreadpoolForce_mergeThreads

Le dimensioni del pool di thread forza unione.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Media, Somma

ThreadpoolIndexQueue

Il numero di attività in coda nel pool di thread di indice. Se la dimensione della coda è costantemente elevata, valutare la possibilità di ridimensionare il cluster. La dimensione massima della coda dell'indice è di 200.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

ThreadpoolIndexRejected

Il numero di attività rifiutate nel pool di thread di indice. Se questo numero cresce costantemente, valutare la possibilità di ridimensionare il cluster.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma

ThreadpoolIndexThreads

Le dimensioni del pool di thread di indice.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Media, Somma

ThreadpoolSearchQueue

Il numero di attività in coda nel pool di thread di ricerca. Se la dimensione della coda è costantemente elevata, valutare la possibilità di ridimensionare il cluster. La dimensione massima della coda di ricerca è di 1.000.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

ThreadpoolSearchRejected

Il numero di attività rifiutate nel pool di thread di ricerca. Se questo numero cresce costantemente, valutare la possibilità di ridimensionare il cluster.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma

ThreadpoolSearchThreads

Le dimensioni del pool di thread di ricerca.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Media, Somma

Threadpoolsql-workerQueue

Il numero di attività in coda nel pool di thread di SQL ricerca. Se la dimensione della coda è costantemente elevata, valutare la possibilità di ridimensionare il cluster.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

Threadpoolsql-workerRejected

Il numero di attività rifiutate nel pool di thread di SQL ricerca. Se questo numero cresce costantemente, valutare la possibilità di ridimensionare il cluster.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma

Threadpoolsql-workerThreads

La dimensione del pool di thread SQL di ricerca.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Media, Somma

ThreadpoolBulkQueue

Il numero di attività in coda nel pool di thread blocco. Se la dimensione della coda è costantemente elevata, valutare la possibilità di ridimensionare il cluster.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

ThreadpoolBulkRejected

Il numero di attività rifiutate nel pool di thread blocco. Se questo numero cresce costantemente, valutare la possibilità di ridimensionare il cluster.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma

ThreadpoolBulkThreads

Le dimensioni del pool di thread blocco.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Media, Somma

ThreadpoolIndexSearcherQueue

Il numero di attività in coda nel pool di thread di index searcher.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

ThreadpoolIndexSearcherRejected

Il numero di attività rifiutate nel pool di thread di index searcher.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma

ThreadpoolIndexSearcherThreads

La dimensione del pool di thread di Index Searcher.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Media, Somma

ThreadpoolWriteThreads

La dimensione del pool di thread di scrittura.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Media, Somma

ThreadpoolWriteQueue

Il numero di attività in coda nel pool di thread di scrittura.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Media, Somma

ThreadpoolWriteRejected

Il numero di attività rifiutate nel pool di thread di scrittura.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Media, Somma

Nota

Poiché la dimensione predefinita della coda di scrittura è stata aumentata da 200 a 10000 nella versione 7.1, questa metrica non è più l'unico indicatore dei rifiuti da parte del Servizio. OpenSearch Utilizzare i parametri CoordinatingWriteRejected, PrimaryWriteRejected e ReplicaWriteRejected per monitorare i rifiuti nelle versioni 7.1 e successive.

CoordinatingWriteRejected

Il numero totale di rifiuti si è verificato sul nodo di coordinamento a causa della pressione di indicizzazione dall'ultimo avvio del processo di servizio. OpenSearch

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Media, Somma

Questo parametro è disponibile nella versione 7.1 e nelle versioni successive.

PrimaryWriteRejected

Il numero totale di rifiuti si è verificato sugli shard primari a causa della pressione di indicizzazione dall'ultimo avvio del processo di servizio. OpenSearch

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Media, Somma

Questo parametro è disponibile nella versione 7.1 e nelle versioni successive.

ReplicaWriteRejected

Il numero totale di rifiuti si è verificato sugli shard di replica a causa della pressione di indicizzazione dall'ultimo avvio del processo di servizio. OpenSearch

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Media, Somma

Questo parametro è disponibile nella versione 7.1 e nelle versioni successive.

UltraWarm metriche

Amazon OpenSearch Service fornisce le seguenti metriche per UltraWarmi nodi.

Parametro Descrizione
WarmCPUUtilization

La percentuale di CPU utilizzo dei UltraWarm nodi del cluster. Massimo mostra il nodo con il massimo CPU utilizzo. La media rappresenta tutti UltraWarm i nodi del cluster. Questa metrica è disponibile anche per i singoli UltraWarm nodi.

Statistiche rilevanti: Maximum (Massimo), Average (Media)

WarmFreeStorageSpace

La quantità di spazio di archiviazione a caldo gratuito in MiB. Poiché UltraWarm utilizza Amazon S3 anziché dischi collegati, Sum è l'unica statistica rilevante. È necessario lasciare il periodo su un minuto per ottenere un valore preciso.

Statistiche rilevanti: Sum (Somma)

WarmSearchableDocuments

Il numero totale di documenti disponibili per la ricerca tra tutti gli indici a caldo nel cluster. È necessario lasciare il periodo su un minuto per ottenere un valore preciso.

Statistiche rilevanti: Sum (Somma)

WarmSearchLatency

La differenza nel tempo totale, in millisecondi, rilevato da tutte le ricerche in un intervallo UltraWarm compreso tra il minuto N e il minuto (N-1).

Statistiche di nodo rilevanti: Media

Statistiche del cluster rilevanti: Media, Massima

WarmSearchRate

Il numero totale di richieste di ricerca al minuto per tutti gli shard su un nodo. UltraWarm Una singola chiamata a _search API potrebbe restituire risultati da molti shard diversi. Se cinque di queste partizioni si trovano in un solo nodo, il nodo indicherà 5 per questo parametro, anche se il client ha effettuato una sola richiesta.

Statistiche di nodo rilevanti: Media

Statistiche del cluster rilevanti: Media, Massima, Somma

WarmStorageSpaceUtilization

La quantità totale di spazio di archiviazione a caldo, in MiB, che sta utilizzando il cluster.

Statistiche rilevanti: Massima

HotStorageSpaceUtilization

La quantità totale di spazio di archiviazione ad accesso frequente utilizzata dal cluster.

Statistiche rilevanti: Massima

WarmSysMemoryUtilization

La percentuale di memoria del nodo Warm utilizzata.

Statistiche rilevanti: Massima

HotToWarmMigrationQueueSize

Il numero di indici attualmente in attesa di migrazione dall'archiviazione ad accesso frequente a quella a caldo.

Statistiche rilevanti: Massima

WarmToHotMigrationQueueSize

Il numero di indici attualmente in attesa di migrazione dall'archiviazione a caldo a quella ad accesso frequente.

Statistiche rilevanti: Massima

HotToWarmMigrationFailureCount

Il numero totale di migrazioni da "ad accesso frequente" a "a caldo" non riuscite.

Statistiche rilevanti: Sum (Somma)

HotToWarmMigrationForceMergeLatency

La latenza media della fase di unione forzata del processo di migrazione. Se questa fase richiede costantemente troppo tempo, prendere in considerazione l'aumento di index.ultrawarm.migration.force_merge.max_num_segments.

Statistiche rilevanti: Average (Media)

HotToWarmMigrationSnapshotLatency

La latenza media della fase di snapshot del processo di migrazione. Se questa fase richiede troppo tempo, assicurarsi che le partizioni siano dimensionate e distribuite in modo appropriato in tutto il cluster.

Statistiche rilevanti: Average (Media)

HotToWarmMigrationProcessingLatency

La latenza media delle migrazioni riuscite da "ad accesso frequente" a "a caldo", senza includere il tempo trascorso nella coda. Questo valore è la somma del tempo necessario per completare le fasi di unione forzata, snapshot e rilocazione delle partizioni del processo di migrazione.

Statistiche rilevanti: Average (Media)

HotToWarmMigrationSuccessCount

Il numero totale di migrazioni riuscite da "ad accesso frequente" a "a caldo".

Statistiche rilevanti: Sum (Somma)

HotToWarmMigrationSuccessLatency

La latenza media delle migrazioni riuscite da "ad accesso frequente" a "a caldo", compreso il tempo trascorso nella coda.

Statistiche rilevanti: Average (Media)

WarmThreadpoolSearchThreads

La dimensione del pool di thread UltraWarm di ricerca.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Media, Somma

WarmThreadpoolSearchRejected

Il numero di attività rifiutate nel pool UltraWarm di thread di ricerca. Se questo numero aumenta continuamente, valuta la possibilità di aggiungere altri UltraWarm nodi.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma

WarmThreadpoolSearchQueue Il numero di attività in coda nel pool di thread di UltraWarm ricerca. Se la dimensione della coda è costantemente elevata, valuta la possibilità di aggiungere altri nodi. UltraWarm

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

WarmJVMMemoryPressure

La percentuale massima dell'heap Java utilizzata per i UltraWarm nodi.

Statistiche rilevanti: Massima

Nota

La logica di questo parametro è cambiata nel software del servizio R20220323. Per ulteriori informazioni, consulta le note di rilascio.

WarmOldGenJVMMemoryPressure

La percentuale massima dell'heap Java utilizzato per la «vecchia generazione» per UltraWarm nodo.

Statistiche rilevanti: Massima

WarmJVMGCYoungCollectionCount

Il numero di volte in cui la raccolta dei rifiuti delle «giovani generazioni» è stata eseguita sui nodi. UltraWarm Un numero elevato e in continua crescita di esecuzioni è una parte normale delle operazioni del cluster.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

WarmJVMGCYoungCollectionTime

La quantità di tempo, in millisecondi, impiegata dal cluster per eseguire la raccolta dei rifiuti di «nuova generazione» sui nodi. UltraWarm

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

WarmJVMGCOldCollectionCount

Il numero di volte in cui la raccolta dei rifiuti di «vecchia generazione» è stata eseguita sui nodi. UltraWarm In un cluster con risorse sufficienti, questo numero deve rimanere basso e senza frequenti incrementi.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

WarmConcurrentSearchRate

Il numero totale di richieste di ricerca che utilizzano la ricerca simultanea per segmenti al minuto per tutti gli shard su un nodo. UltraWarm Una singola chiamata a _search API potrebbe restituire risultati da molti shard diversi. Se cinque di queste partizioni si trovano in un solo nodo, il nodo indicherà 5 per questo parametro, anche se il client ha effettuato una sola richiesta.

Statistiche di nodo rilevanti: Media

Statistiche del cluster rilevanti: Somma, Massimo, Media

WarmConcurrentSearchLatency

La differenza nel tempo totale, in millisecondi, impiegato da tutte le ricerche che utilizzano la ricerca simultanea per segmenti in un UltraWarm nodo tra il minuto N e il minuto (N-1).

Statistiche di nodo rilevanti: Media

Statistiche cluster rilevanti: Massima, Media

WarmThreadpoolIndexSearcherQueue

Il numero di attività in coda nel pool di thread di index searcher. UltraWarm

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma, Massimo, Media

WarmThreadpoolIndexSearcherRejected

Il numero di attività rifiutate nel pool di thread di UltraWarm index searcher.

Statistiche di nodo rilevanti: Massima

Statistiche del cluster rilevanti: Somma

WarmThreadpoolIndexSearcherThreads

La dimensione del pool di thread di UltraWarm Index Searcher.

Statistiche di nodo rilevanti: Massima

Statistiche pertinenti sui cluster: somma, media

Parametri di archiviazione a freddo

Amazon OpenSearch Service fornisce le seguenti metriche per la conservazione a freddo.

Parametro Descrizione
ColdStorageSpaceUtilization

La quantità totale di spazio di archiviazione a freddo, in MiB, utilizzato dal cluster.

Statistiche rilevanti: Max (Massimo)

ColdToWarmMigrationFailureCount

Il numero totale di migrazioni da freddo a caldo non riuscite.

Statistiche rilevanti: Sum (Somma)

ColdToWarmMigrationLatency

Il tempo necessario per completare le migrazioni da freddo a caldo riuscite.

Statistiche rilevanti: Average (Media)

ColdToWarmMigrationQueueSize

Il numero di indici attualmente in attesa di migrazione dall'archiviazione a freddo a quella a caldo.

Statistiche rilevanti: Massima

ColdToWarmMigrationSuccessCount

Il numero totale di migrazioni da freddo a caldo riuscite.

Statistiche rilevanti: Sum (Somma)

WarmToColdMigrationFailureCount

Il numero totale di migrazioni da caldo a freddo non riuscite.

Statistiche rilevanti: Sum (Somma)

WarmToColdMigrationLatency

Il tempo necessario per completare le migrazioni da caldo a freddo riuscite.

Statistiche rilevanti: Average (Media)

WarmToColdMigrationQueueSize

Il numero di indici attualmente in attesa di migrazione dall'archiviazione a caldo a quella a freddo.

Statistiche rilevanti: Massima

WarmToColdMigrationSuccessCount

Il numero totale di migrazioni da caldo a freddo riuscite.

Statistiche rilevanti: Sum (Somma)

OR1metriche

Amazon OpenSearch Service fornisce le seguenti metriche per le OR1istanze.

Parametro Descrizione
RemoteStorageUsedSpace

La quantità totale di spazio Amazon S3, in MiB, utilizzata dal cluster.

Statistiche rilevanti: Sum (Somma)

RemoteStorageWriteRejected

Il numero totale di richieste rifiutate sugli shard primari a causa della pressione di storage e replica remoti. Viene calcolato a partire dall'ultimo avvio del processo OpenSearch di servizio.

Statistiche rilevanti: Sum (Somma)

ReplicationLagMaxTime

La quantità di tempo, in millisecondi, in cui gli shard di replica restano indietro rispetto agli shard primari.

Statistiche rilevanti: Massima

Parametri di avvisi

Amazon OpenSearch Service fornisce le seguenti metriche per gli avvisi.

Parametro Descrizione
AlertingDegraded

Il valore 1 indica che l'indice di allerta è rosso oppure uno o più nodi non sono pianificati. Un valore 0 indica un comportamento normale.

Statistiche rilevanti: Massima

AlertingIndexExists

Un valore pari a 1 significa che l'indice .opensearch-alerting-config esiste. Un valore pari a 0 significa che non esiste. Fino a quando non si utilizza la funzione di allarme per la prima volta, questo valore rimane 0.

Statistiche rilevanti: Massima

AlertingIndexStatus.green

La salute dell'indice. Un valore pari a 1 significa verde. Un valore pari a 0 significa che l'indice non esiste o non è verde.

Statistiche rilevanti: Massima

AlertingIndexStatus.red

La salute dell'indice. Un valore pari a 1 significa rosso. Un valore pari a 0 significa che l'indice non esiste o non è rosso.

Statistiche rilevanti: Massima

AlertingIndexStatus.yellow

La salute dell'indice. Un valore pari a 1 significa giallo. Un valore pari a 0 significa che l'indice non esiste o non è giallo.

Statistiche rilevanti: Massima

AlertingNodesNotOnSchedule

Il valore 1 indica che alcuni processi non sono in esecuzione nei tempi previsti. Il valore 0 indica che tutti i processi di allerta sono in esecuzione nella pianificazione (o che non esistono processi di avvisi). Controlla la console OpenSearch di servizio o fai una _nodes/stats richiesta per vedere se alcuni nodi mostrano un elevato utilizzo delle risorse.

Statistiche rilevanti: Massima

AlertingNodesOnSchedule

Il valore 1 indica che tutti i processi di allerta sono in esecuzione nella pianificazione (o che non esistono processi di avvisi). Un valore pari a 0 indica che alcuni processi non sono in esecuzione nella pianificazione.

Statistiche rilevanti: Massima

AlertingScheduledJobEnabled

Il valore 1 indica che l'impostazione del cluster opensearch.scheduled_jobs.enabled è true. Il valore 0 indica che è falsa e i processi pianificati sono disabilitati.

Statistiche rilevanti: Massima

Parametri di rilevamento delle anomalie

Amazon OpenSearch Service fornisce le seguenti metriche per il rilevamento delle anomalie.

Parametro Descrizione
ADPluginUnhealthy

Il valore 1 indica che il plug-in di rilevamento delle anomalie non funziona correttamente, a causa di un numero elevato di errori o perché uno degli indici utilizzati è rosso. Il valore 0 indica che il plugin funziona come previsto.

Statistiche rilevanti: Massima

ADExecuteRequestCount

Numero di richieste per il rilevamento delle anomalie.

Statistiche rilevanti: Sum (Somma)

ADExecuteFailureCount

Numero di richieste non riuscite per il rilevamento delle anomalie.

Statistiche rilevanti: Sum (Somma)

ADHCExecuteFailureCount

Il numero di richieste non riuscite per il rilevamento delle anomalie per i rilevatori ad alta cardinalità.

Statistiche rilevanti: Sum (Somma)

ADHCExecuteRequestCount

Il numero di richieste per il rilevamento delle anomalie per i rilevatori ad alta cardinalità.

Statistiche rilevanti: Sum (Somma)

ADAnomalyResultsIndexStatusIndexExists

Il valore 1 indica che l'indice a cui punta l'alias .opensearch-anomaly-results esiste. Fino a quando non si utilizza la funzionalità di rilevamento delle anomalie per la prima volta, questo valore rimane 0.

Statistiche rilevanti: Massima

ADAnomalyResultsIndexStatus.red

Il valore 1 indica che l'indice a cui punta l'alias .opensearch-anomaly-results è rosso. Un valore pari a 0 significa che non lo è. Fino a quando non si utilizza la funzionalità di rilevamento delle anomalie per la prima volta, questo valore rimane 0.

Statistiche rilevanti: Massima

ADAnomalyDetectorsIndexStatusIndexExists

Un valore pari a 1 significa che l'indice .opensearch-anomaly-detectors esiste. Un valore pari a 0 significa che non esiste. Fino a quando non si utilizza la funzionalità di rilevamento delle anomalie per la prima volta, questo valore rimane 0.

Statistiche rilevanti: Massima

ADAnomalyDetectorsIndexStatus.red

Un valore pari a 1 indica che l'indice .opensearch-anomaly-detectors è rosso. Un valore pari a 0 significa che non lo è. Fino a quando non si utilizza la funzionalità di rilevamento delle anomalie per la prima volta, questo valore rimane 0.

Statistiche rilevanti: Massima

ADModelsCheckpointIndexStatusIndexExists

Un valore pari a 1 significa che l'indice .opensearch-anomaly-checkpoints esiste. Un valore pari a 0 significa che non esiste. Fino a quando non si utilizza la funzionalità di rilevamento delle anomalie per la prima volta, questo valore rimane 0.

Statistiche rilevanti: Massima

ADModelsCheckpointIndexStatus.red

Un valore pari a 1 indica che l'indice .opensearch-anomaly-checkpoints è rosso. Un valore pari a 0 significa che non lo è. Fino a quando non si utilizza la funzionalità di rilevamento delle anomalie per la prima volta, questo valore rimane 0.

Statistiche rilevanti: Massima

Amazon OpenSearch Service fornisce le seguenti metriche per la ricerca asincrona.

Statistiche del nodo coordinatore di ricerca asincrona (per nodo coordinatore)

Parametro Descrizione
AsynchronousSearchSubmissionRate

Il numero di ricerche asincrone inviate nell'ultimo minuto.

AsynchronousSearchInitializedRate

Il numero di ricerche asincrone inizializzate nell'ultimo minuto.

AsynchronousSearchRunningCurrent

Il numero di ricerche asincrone correntemente in esecuzione.

AsynchronousSearchCompletionRate

Il numero di ricerche asincrone completate correttamente nell'ultimo minuto.

AsynchronousSearchFailureRate

Il numero di ricerche asincrone completate e non riuscite nell'ultimo minuto.

AsynchronousSearchPersistRate

Il numero di ricerche asincrone conservate nell'ultimo minuto.

AsynchronousSearchPersistFailedRate

Il numero di ricerche asincrone che non sono state conservate nell'ultimo minuto.

AsynchronousSearchRejected

Il numero totale di ricerche asincrone rifiutate dall'attivazione del nodo.

AsynchronousSearchCancelled

Il numero totale di ricerche asincrone cancellate dall'attivazione del nodo.

AsynchronousSearchMaxRunningTime

La durata della ricerca asincrona più lunga in esecuzione su un nodo nell'ultimo minuto.

Statistiche del cluster di ricerca asincrona

Parametro Descrizione
AsynchronousSearchStoreHealth

Lo stato del negozio nell'indice persistente (REDRED/non-) nell'ultimo minuto.

AsynchronousSearchStoreSize

La dimensione dell'indice di sistema su tutte le partizioni nell'ultimo minuto.

AsynchronousSearchStoredResponseCount

Il numero di risposte memorizzate nell'indice di sistema nell'ultimo minuto.

Metriche Auto-Tune

Amazon OpenSearch Service fornisce le seguenti metriche per Auto-Tune.

Parametro Descrizione
AutoTuneChangesHistoryHeapSize

La cronologia delle modifiche in MiB per i valori di ottimizzazione della dimensione dell'heap.

AutoTuneChangesHistoryJVMYoungGenArgs

La cronologia delle modifiche per gli argomenti. JVM YongGen

AutoTuneFailed

Un valore booleano che indica se la modifica Auto-Tune non è riuscita.

AutoTuneSucceeded

Un valore booleano che indica se la modifica Auto-Tune è stata completata.

AutoTuneValue La cronologia delle modifiche alla coda (count) e le ottimizzazioni della cache modificano la cronologia (in MiB) per modifiche senza interruzioni.

Multi-AZ con metriche Standby

Amazon OpenSearch Service fornisce le seguenti metriche per Multi-AZ with Standby.

Metriche a livello di nodo per i nodi di dati nelle zone di disponibilità attive

Parametro Descrizione
CPUUtilization La percentuale di CPU utilizzo dei nodi di dati nel cluster. Massimo mostra il nodo con il massimo CPU utilizzo. La media rappresenta tutti i nodi del cluster. Questo parametro è disponibile anche per singoli nodi.
FreeStorageSpace

Lo spazio libero per i nodi di dati nel cluster. Sum mostra lo spazio libero totale per il cluster, ma è necessario lasciare il periodo a un minuto per ottenere un valore accurato. Minimum e Maximum mostrano i nodi con lo spazio libero maggiore e minore, rispettivamente. Questa metrica è disponibile anche per i singoli nodi. OpenSearch Il servizio genera un ClusterBlockException quando questa metrica raggiunge. 0 Per eseguire il ripristino, è necessario eliminare gli indici, aggiungere istanze più grandi o aggiungere storage EBS basato sulle istanze esistenti. Per ulteriori informazioni, consulta Mancanza di spazio di archiviazione disponibile.

La console OpenSearch di servizio visualizza questo valore in GiB. La CloudWatch console Amazon lo visualizza in MiB.

JVMMemoryPressure La percentuale massima dell'heap Java utilizzata per tutti i nodi di dati del cluster. OpenSearch Il servizio utilizza metà di un'istanza RAM per l'heap Java, fino a una dimensione dell'heap di 32 GiB. È possibile scalare le istanze verticalmente fino a 64 GiB diRAM, a quel punto è possibile scalare orizzontalmente aggiungendo istanze. Per informazioni, consulta CloudWatch Allarmi consigliati per Amazon Service OpenSearch .
SysMemoryUtilization La percentuale di memoria dell'istanza utilizzata. I valori elevati per questa metrica sono normali e in genere non rappresentano un problema con il cluster. Per un migliore indicatore dei potenziali problemi di prestazioni e stabilità, vedere la metrica JVMMemoryPressure.
IndexingLatency

La differenza nel tempo totale, in millisecondi, rilevata da tutte le operazioni di indicizzazione in un nodo tra i minuti N e i minuti (N-1).

IndexingRate Il numero di operazioni di indicizzazione al minuto.
SearchLatency

La differenza nel tempo totale, in millisecondi, rilevato da tutte le ricerche in un nodo tra il minuto N e il minuto (N-1).

SearchRate Il numero totale di richieste di ricerca al minuto per tutte le partizioni in un nodo di dati.
ThreadpoolSearchQueue Il numero di attività in coda nel pool di thread di ricerca. Se la dimensione della coda è costantemente elevata, valutare la possibilità di ridimensionare il cluster. La dimensione massima della coda di ricerca è di 1.000.
ThreadpoolWriteQueue Il numero di attività in coda nel pool di thread di scrittura.
ThreadpoolSearchRejected

Il numero di attività rifiutate nel pool di thread di ricerca. Se questo numero cresce costantemente, valutare la possibilità di ridimensionare il cluster.

ThreadpoolWriteRejected Il numero di attività rifiutate nel pool di thread di scrittura.

Metriche a livello di cluster per i cluster nelle zone di disponibilità attive

Parametro Descrizione
DataNodes Il numero totale di shard attivi e in standby.
DataNodesShards.active Il numero totale di partizioni primarie e di replica attive.
DataNodesShards.unassigned

Il numero di partizioni non allocate ai nodi nel cluster.

DataNodesShards.initializing Il numero di partizioni in fase di inizializzazione.
DataNodesShards.relocating Il numero di partizioni in fase di rilocazione.

Metriche di rotazione della zona di disponibilità

SeActiveReads.Availability-Zone = 1, allora la zona è attiva. SeActiveReads.Availability-Zone = 0, allora la zona è in standby.

Metriche puntuali

Amazon OpenSearch Service fornisce le seguenti metriche per le ricerche point-in-time (PIT).

PITstatistiche sul nodo coordinatore (per nodo coordinatore)

Parametro Descrizione
CurrentPointInTime Il numero di contesti di PIT ricerca attivi nel nodo.
TotalPointInTime Il numero di contesti di PIT ricerca scaduti dal momento dell'attività del nodo.
AvgPointInTimeAliveTime La durata media dei contesti di PIT ricerca dal momento in cui il nodo è attivo.
HasActivePointInTime Il valore 1 indica che ci sono PIT contesti attivi sui nodi dal momento in cui il nodo è attivo. Un valore pari a 0 significa che non ce ne sono.
HasUsedPointInTime Il valore 1 indica che ci sono PIT contesti scaduti sui nodi dal momento in cui il nodo è attivo. Un valore pari a 0 significa che non ce ne sono.

SQLmetriche

Amazon OpenSearch Service fornisce le seguenti metriche per l'SQLassistenza.

Parametro Descrizione
SQLFailedRequestCountByCusErr

Il numero di richieste ricevute _sql API che non sono riuscite a causa di un problema con il client. Ad esempio, una richiesta potrebbe restituire il codice di HTTP stato 400 a causa di unIndexNotFoundException.

Statistiche rilevanti: Sum (Somma)

SQLFailedRequestCountBySysErr

Il numero di richieste non riuscite a causa di un problema del server o di una limitazione delle funzionalità. _sql API Ad esempio, una richiesta potrebbe restituire il codice di HTTP stato 503 a causa di unVerificationException.

Statistiche rilevanti: Sum (Somma)

SQLRequestCount

Il numero di richieste a. _sql API

Statistiche rilevanti: Sum (Somma)

SQLDefaultCursorRequestCount

Simile aSQLRequestCount, ma conta solo le richieste di impaginazione.

Statistiche rilevanti: Sum (Somma)

SQLUnhealthy

Il valore 1 indica che, in risposta a determinate richieste, il SQL plugin restituisce 5 codici di risposta xx o sta passando una query DSL non valida a. OpenSearch Altre richieste dovrebbero continuare ad avere esito positivo. Un valore pari a 0 indica nessun errore recente. Se viene visualizzato un valore sostenuto pari a 1, risolvere i problemi relativi alle richieste che i client stanno facendo al plugin.

Statistiche rilevanti: Massima

Parametri k-NN

Amazon OpenSearch Service include le seguenti metriche per il plugin k-Nearest Neighbor (k-NN).

Parametro Descrizione
KNNCacheCapacityReached

Parametro per nodo per stabilire se è stata raggiunta la capacità della cache. Questo parametro è rilevante solo per approssimare la ricerca k-NN.

Statistiche rilevanti: Massima

KNNCircuitBreakerTriggered

Parametro per cluster per indicare se l'interruttore è attivato. Se alcuni nodi restituiscono un valore pari a 1 per KNNCacheCapacityReached, anche questo valore restituirà 1. Questo parametro è rilevante solo per approssimare la ricerca k-NN.

Statistiche rilevanti: Massima

KNNEvictionCount

Parametro per nodo per il numero di grafici rimossi dalla cache a causa di vincoli di memoria o tempo di inattività. Le rimozioni esplicite che si verificano a causa dell'eliminazione dell'indice non vengono conteggiate. Questo parametro è rilevante solo per approssimare la ricerca k-NN.

Statistiche rilevanti: Sum (Somma)

KNNGraphIndexErrors

Parametro per nodo per il numero di richieste da aggiungere il campo knn_vector di un documento a un grafico che ha generato un errore.

Statistiche rilevanti: Sum (Somma)

KNNGraphIndexRequests

Parametro per nodo per il numero di richieste per aggiungere il campo knn_vector di un documento a un grafico.

Statistiche rilevanti: Sum (Somma)

KNNGraphMemoryUsage

Parametro per nodo per la dimensione della cache corrente (dimensione totale di tutti i grafici in memoria) in kilobyte. Questo parametro è rilevante solo per approssimare la ricerca k-NN.

Statistiche rilevanti: Average (Media)

KNNGraphQueryErrors

Parametro per nodo per il numero di query del grafico che hanno generato un errore.

Statistiche rilevanti: Sum (Somma)

KNNGraphQueryRequests

Parametro per nodo per il numero di query del grafico.

Statistiche rilevanti: Sum (Somma)

KNNHitCount

Parametro per nodo per il numero di occorrenze della cache. Una occorrenza della cache si verifica quando un utente esegue una query su un grafico già caricato in memoria. Questo parametro è rilevante solo per approssimare la ricerca k-NN.

Statistiche rilevanti: Sum (Somma)

KNNLoadExceptionCount

Parametro per nodo per il numero di volte in cui si è verificata un'eccezione durante il tentativo di caricare un grafico nella cache. Questo parametro è rilevante solo per approssimare la ricerca k-NN.

Statistiche rilevanti: Sum (Somma)

KNNLoadSuccessCount

Parametro per nodo per il numero di volte in cui il plug-in ha caricato correttamente un grafico nella cache. Questo parametro è rilevante solo per approssimare la ricerca k-NN.

Statistiche rilevanti: Sum (Somma)

KNNMissCount

Parametro per nodo per il numero di mancati riscontri nella cache. Un mancato riscontro nella cache si verifica quando un utente esegue una query su un grafico non ancora caricato in memoria. Questo parametro è rilevante solo per approssimare la ricerca k-NN.

Statistiche rilevanti: Sum (Somma)

KNNQueryRequests

Parametro per nodo per il numero di richieste di query ricevute dal plugin k-NN.

Statistiche rilevanti: Sum (Somma)

KNNScriptCompilationErrors

Parametro per nodo per il numero di errori durante la compilazione dello script. Questa statistica è rilevante solo per la ricerca di script di punteggio k-NN.

Statistiche rilevanti: Sum (Somma)

KNNScriptCompilations

Parametro per nodo per il numero di volte in cui lo script k-NN è stato compilato. Questo valore dovrebbe in genere essere 1 o 0, ma se la cache contenente gli script compilati viene riempita, lo script k-NN potrebbe essere ricompilato. Questa statistica è rilevante solo per la ricerca di script di punteggio k-NN.

Statistiche rilevanti: Sum (Somma)

KNNScriptQueryErrors

Parametro per nodo per il numero di errori durante le query dello script. Questa statistica è rilevante solo per la ricerca di script di punteggio k-NN.

Statistiche rilevanti: Sum (Somma)

KNNScriptQueryRequests

Parametro per nodo per il numero totale di query dello script. Questa statistica è rilevante solo per la ricerca di script di punteggio k-NN.

Statistiche rilevanti: Sum (Somma)

KNNTotalLoadTime

Il tempo in nanosecondi impiegato da k-NN per caricare i grafici nella cache. Questo parametro è rilevante solo per approssimare la ricerca k-NN.

Statistiche rilevanti: Sum (Somma)

Amazon OpenSearch Service fornisce le seguenti metriche per la ricerca tra cluster.

Parametri del dominio di origine

Parametro Dimensione Descrizione
CrossClusterOutboundConnections

ConnectionId

Numero di nodi connessi. Se la risposta include uno o più domini ignorati, utilizzare questo parametro per tracciare eventuali connessioni non integre. Se questo numero scende a 0, la connessione non è integra.

CrossClusterOutboundRequests

ConnectionId

Numero di richieste di ricerca inviate al dominio di destinazione. Utilizzalo per verificare se il carico di richieste di ricerca tra cluster sta sovraccaricando il tuo dominio, e metti in correlazione qualsiasi picco di questa metrica con qualsiasi /spike. JVM CPU

Parametri del dominio di destinazione

Parametro Dimensione Descrizione
CrossClusterInboundRequests

ConnectionId

Numero di richieste di connessione in ingresso ricevute dal dominio di origine.

Aggiungi un CloudWatch allarme nel caso in cui perdi una connessione in modo imprevisto. Per i passaggi per creare un allarme, vedi Creare un CloudWatch allarme basato su una soglia statica.

Parametri di replica tra cluster

Amazon OpenSearch Service fornisce le seguenti metriche per la replica tra cluster.

Parametro Descrizione
ReplicationRate

La percentuale media di operazioni di replica al secondo. Questo parametro è analogo al parametro IndexingRate.

LeaderCheckPoint

Per una connessione specifica, la somma dei valori del checkpoint leader in tutti gli indici di replica. Puoi utilizzare questo parametro per misurare la latenza di replica.

FollowerCheckPoint

Per una connessione specifica, la somma dei valori del checkpoint follower in tutti gli indici di replica. Puoi utilizzare questo parametro per misurare la latenza di replica.

ReplicationNumSyncingIndices

Il numero di indici con uno stato di replica di SYNCING.

ReplicationNumBootstrappingIndices

Il numero di indici con uno stato di replica di BOOTSTRAPPING.

ReplicationNumPausedIndices

Il numero di indici con uno stato di replica di PAUSED.

ReplicationNumFailedIndices

Il numero di indici con uno stato di replica di FAILED.

CrossClusterOutboundReplicationRequests

Il numero di richieste di trasporto di replica sul dominio del follower. Le richieste di trasporto sono interne e si verificano ogni volta che viene chiamata un'APIoperazione di replica. Si verificano anche quando il dominio follower effettua il polling rispetto al dominio leader.

CrossClusterInboundReplicationRequests

Il numero di richieste di trasporto di replica sul dominio leader. Le richieste di trasporto sono interne e si verificano ogni volta che viene chiamata un'APIoperazione di replica.

AutoFollowNumSuccessStartReplication

Il numero di indici follower creati correttamente da una regola di replica per una connessione specifica.

AutoFollowNumFailedStartReplication

Il numero di indici follower che non sono stati creati da una regola di replica in presenza di un modello corrispondente. Questo problema potrebbe sorgere a causa di un problema di rete sul cluster remoto o di un problema di sicurezza (ad esempio, il ruolo associato non ha l'autorizzazione per avviare la replica).

AutoFollowLeaderCallFailure

Se ci sono state query non riuscite dall'indice follower all'indice leader per estrarre nuovi dati. Un valore pari a 1 significa che ci sono state una o più chiamate non riuscite nell'ultimo minuto.

Parametri di Learning to Rank

Amazon OpenSearch Service fornisce le seguenti metriche per Learning to Rank.

Parametro Descrizione
LTRRequestTotalCount

Conteggio totale delle richieste di classificazione.

LTRRequestErrorCount

Conteggio totale delle richieste non riuscite.

LTRStatus.red

Traccia se uno degli indici necessari per eseguire il plug-in è rosso.

LTRMemoryUsage

La memoria totale utilizzata dal plug-in.

LTRFeatureMemoryUsageInBytes

La quantità di memoria, espressa in byte, utilizzata dai campi della funzionalità Learning to Rank.

LTRFeaturesetMemoryUsageInBytes

La quantità di memoria, espressa in byte, utilizzata dai set di funzionalità Learning to Rank.

LTRModelMemoryUsageInBytes

La quantità di memoria, espressa in byte, utilizzata da tutti i modelli Learning to Rank.

Parametri Piped Processing Language (PPL)

Amazon OpenSearch Service fornisce le seguenti metriche per Piped Processing Language.

Parametro Descrizione
PPLFailedRequestCountByCusErr

Il numero di richieste ricevute _ppl API che non sono riuscite a causa di un problema con il client. Ad esempio, una richiesta potrebbe restituire il codice di HTTP stato 400 a causa di unIndexNotFoundException.

PPLFailedRequestCountBySysErr

Il numero di richieste non riuscite a causa di un problema del server o di una limitazione delle funzionalità. _ppl API Ad esempio, una richiesta potrebbe restituire il codice di HTTP stato 503 a causa di unVerificationException.

PPLRequestCount

Il numero di richieste a. _ppl API