Überwachung von OpenSearch Cluster-Metriken mit Amazon CloudWatch - OpenSearch Amazon-Dienst

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachung von OpenSearch Cluster-Metriken mit Amazon CloudWatch

Amazon OpenSearch Service veröffentlicht Daten von Ihren Domains bei Amazon CloudWatch. CloudWatch ermöglicht es Ihnen, Statistiken über diese Datenpunkte in Form eines geordneten Satzes von Zeitreihendaten, den so genannten Metriken, abzurufen. OpenSearch Der Service sendet die meisten Messwerte CloudWatch in 60-Sekunden-Intervallen an. Wenn Sie universelle oder magnetische EBS-Volumes verwenden, werden die EBS-Volume-Metriken nur alle fünf Minuten aktualisiert. Alle kumulativen Metriken (z. ThreadpoolWriteRejeceted B.ThreadpoolSearchRejected) befinden sich im Arbeitsspeicher und verlieren ihren Status. Metriken werden bei einem Node-Drop, einem Node-Bounce, einem Node-Austausch und einer Blau/Grün-Implementierung zurückgesetzt. Weitere Informationen zu Amazon CloudWatch finden Sie im CloudWatch Amazon-Benutzerhandbuch.

Die OpenSearch Servicekonsole zeigt eine Reihe von Diagrammen an, die auf den Rohdaten von basieren CloudWatch. Je nach Ihren Anforderungen ziehen Sie es möglicherweise vor, die Clusterdaten CloudWatch anstelle der Diagramme in der Konsole anzuzeigen. Der Service archiviert die Metriken für zwei Wochen, bevor sie verworfen werden. Die Metriken werden ohne Aufpreis zur Verfügung gestellt, es fallen CloudWatch jedoch Gebühren für die Erstellung von Dashboards und Alarmen an. Weitere Informationen finden Sie unter CloudWatchAmazon-Preise.

OpenSearch Service veröffentlicht die folgenden Kennzahlen für CloudWatch:

Metriken anzeigen in CloudWatch

CloudWatch Metriken werden zuerst nach dem Service-Namespace und dann nach den verschiedenen Dimensionskombinationen innerhalb der einzelnen Namespaces gruppiert.

Um Metriken mit der Konsole anzuzeigen CloudWatch
  1. Öffnen Sie die CloudWatch Konsole unter https://console.aws.amazon.com/cloudwatch/.

  2. Suchen Sie im linken Navigationsbereich nach Metrics (Metriken) und wählen Sie All metrics (Alle Metriken) aus. Wählen Sie den ES/ OpenSearchService Namespace aus.

  3. Wählen Sie eine Dimension aus, um die entsprechenden Metriken anzuzeigen. Metriken für einzelne Knoten befinden sich in der ClientId, DomainName, NodeId-Dimension. Cluster-Metriken befinden sich in der Per-Domain, Per-Client Metrics-Dimension. Einige Knotenmetriken werden auf Clusterebene aggregiert und somit in beide Dimensionen eingeschlossen. Shard-Metriken befinden sich in der ClientId, DomainName, NodeId, ShardRole-Dimension.

Um eine Liste von Metriken anzuzeigen, verwenden Sie AWS CLI

Führen Sie den folgenden Befehl aus:

aws cloudwatch list-metrics --namespace "AWS/ES"

Interpretieren von Zustandstabellen im OpenSearch Service

Verwenden Sie die Registerkarten Clusterstatus und Instanzstatus, um Metriken in OpenSearch Service anzuzeigen. Die Registerkarte Instanzstatus verwendet Boxdiagramme, um einen at-a-glance Überblick über den Zustand der einzelnen OpenSearch Knoten zu geben:

  • Jedes farbige Feld zeigt den Wertebereich für den Knoten im angegebenen Zeitraum.

  • Blaue Felder stehen für Werte, die mit anderen Knoten konsistent sind. Rote Felder stellen Ausreißer dar.

  • Die weiße Linie innerhalb der einzelnen Felder zeigt den aktuellen Wert des Knotens.

  • Die "Whisker" auf beiden Seiten jedes Feldes zeigen die minimalen und maximalen Werte für alle Knoten über den Zeitraum.

Wenn Sie Änderungen an der Konfiguration Ihrer Domain vornehmen, verdoppelt sich häufig die Größe der Liste mit den einzelnen Instances auf den Registerkarten Cluster health (Cluster-Zustand) und Instance health (Instance-Zustand) für einen kurzen Zeitraum, bevor wieder die richtige Zahl angezeigt wird. Eine Erklärung dieser Verhaltensweise finden Sie unter Konfigurationsänderungen in Amazon OpenSearch Service vornehmen.

Cluster-Metriken

Amazon OpenSearch Service bietet die folgenden Metriken für Cluster.

Metrik Beschreibung
ClusterStatus.green

Ein Wert von 1 gibt an, dass alle Index-Shards zu Knoten im Cluster zugeordnet sind.

Relevante Statistiken: Maximum

ClusterStatus.yellow Ein Wert von 1 bedeutet, dass die primären Shards für alle Indizes den Knoten im Cluster zugewiesen sind, die Replikat-Shards für mindestens einen Index jedoch nicht. Weitere Informationen finden Sie unter Gelber Cluster-Status.

Relevante Statistiken: Maximum

ClusterStatus.red

Ein Wert von 1 gibt an, dass die Primär- und Replikat-Shards für mindestens einen Index keinen Knoten im Cluster zugeordnet sind. Weitere Informationen finden Sie unter Roter Cluster-Status.

Relevante Statistiken: Maximum

Shards.active

Die Gesamtzahl der aktiven primären und Replikat-Shards.

Relevante Statistiken: Maximum, Summe

Shards.unassigned

Die Anzahl der Shards, die Knoten im Cluster nicht zugeordnet sind.

Relevante Statistiken: Maximum, Summe

Shards.delayedUnassigned

Die Anzahl der Shards, deren Knotenzuordnung durch die Timeout-Einstellungen verzögert wurde.

Relevante Statistiken: Maximum, Summe

Shards.activePrimary

Die Anzahl der aktiven primären Shards.

Relevante Statistiken: Maximum, Summe

Shards.initializing

Die Anzahl der Shards, die derzeit initialisiert werden.

Relevante Statistiken: Summe

Shards.relocating

Die Anzahl der Shards, die derzeit verschoben werden.

Relevante Statistiken: Summe

Nodes

Die Anzahl der Knoten im OpenSearch Service-Cluster, einschließlich dedizierter Master-Knoten und UltraWarm Knoten. Weitere Informationen finden Sie unter Konfigurationsänderungen in Amazon OpenSearch Service vornehmen.

Relevante Statistiken: Maximum

SearchableDocuments

Die Gesamtzahl der durchsuchbaren Dokumente in allen Datenknoten im Cluster.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

DeletedDocuments

Die Gesamtzahl der zum Löschen markierten Dokumente in allen Datenknoten im Cluster. Diese Dokumente erscheinen nicht mehr in den Suchergebnissen, sondern entfernen OpenSearch nur gelöschte Dokumente bei der Segmentzusammenführung von der Festplatte. Diese Metrik steigt nach Löschanfragen und sinkt nach Segmentzusammenführungen.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

CPUUtilization

Der Prozentsatz der CPU-Nutzung für Datenknoten im Cluster. „Maximum“ zeigt den Knoten mit der höchsten CPU-Nutzung an. „Average“ (Durchschnitt) stellt alle Knoten im Cluster dar. Diese Metrik ist auch für einzelne Knoten verfügbar.

Relevante Statistiken: Maximum, Durchschnitt

FreeStorageSpace

Der freie Platz für Datenknoten im Cluster. Sum zeigt den gesamten freien Speicherplatz für den Cluster an, Sie müssen jedoch den Zeitraum bei einer Minute belassen, um einen genauen Wert zu erhalten. Minimum und Maximum zeigen die Knoten mit dem wenigsten bzw. dem meisten freien Speicherplatz an. Diese Metrik ist auch für einzelne Knoten verfügbar. OpenSearch Der Service gibt eine ausClusterBlockException, wenn diese Metrik erreicht 0 ist. Zum Wiederherstellen müssen Sie entweder Indizes löschen, größere Instances hinzufügen oder EBS-basierten Speicher zu vorhandenen Instances hinzufügen. Weitere Informationen hierzu finden Sie unter Zu wenig verfügbarer Speicherplatz.

Die OpenSearch Servicekonsole zeigt diesen Wert in GiB an. Die CloudWatch Amazon-Konsole zeigt es in MiB an.

Anmerkung

FreeStorageSpacewird immer niedriger sein als die Werte, die die _cat/allocation APIs OpenSearch _cluster/stats und. OpenSearch Der Service reserviert einen Prozentsatz des Speicherplatzes auf jeder Instanz für interne Operationen. Weitere Informationen finden Sie unter Berechnen von Speicheranforderungen.

Relevante Statistiken: Minimum, Maximum, Durchschnitt, Summe

ClusterUsedSpace

Der insgesamt für den Cluster verwendete Speicherplatz. Sie müssen den Zeitraum bei einer Minute belassen, um einen korrekten Wert zu erhalten.

Die OpenSearch Servicekonsole zeigt diesen Wert in GiB an. Die CloudWatch Amazon-Konsole zeigt es in MiB an.

Relevante Statistiken: Minimum, Maximum

ClusterIndexWritesBlocked

Gibt an, ob Ihr Cluster eingehende Schreibanforderungen akzeptiert oder blockiert. Ein Wert von 0 bedeutet, dass der Cluster Anforderungen akzeptiert. Ein Wert von 1 bedeutet, dass Anforderungen blockiert werden.

Einige der häufigsten Faktoren sind folgende: FreeStorageSpace ist zu gering, oder JVMMemoryPressure ist zu hoch. Um dieses Problem zu lösen, sollten Sie erwägen, mehr Speicherplatz hinzuzufügen oder Ihren Cluster zu skalieren.

Relevante Statistiken: Maximum

JVMMemoryPressure

Der maximale Prozentsatz des Java-Heaps, der für alle Datenknoten im Cluster verwendet wird. OpenSearch Der Dienst verwendet die Hälfte des RAM einer Instanz für den Java-Heap, bis zu einer Heap-Größe von 32 GiB. Sie können Instances bis zu 64 GiB RAM vertikal skalieren. Dann können Sie eine horizontale Skalierung durchführen, indem Sie Instances hinzufügen. Siehe Empfohlene CloudWatch Alarme für Amazon OpenSearch Service.

Relevante Statistiken: Maximum

Anmerkung

Die Logik für diese Metrik wurde in der Service-Software R20220323 geändert. Weitere Informationen finden Sie in den Versionshinweisen.

OldGenJVMMemoryPressure

Der maximale Prozentsatz des Java-Heaps, der für die „alte Generation“ auf allen Datenknoten im Cluster verwendet wird. Diese Metrik ist auch auf Knotenebene verfügbar.

Relevante Statistiken: Maximum

AutomatedSnapshotFailure

Die Anzahl fehlgeschlagener automatischer Snapshots für den Cluster. Der Wert 1 gibt an, dass keine automatischen Snapshots für die Domain in den vorherigen 36 Stunden erstellt wurden.

Relevante Statistiken: Minimum, Maximum

CPUCreditBalance

Das verbleibende CPU-Guthaben für die Datenknoten im Cluster. Ein CPU-Guthaben stellt die Leistung eines gesamten CPU-Kerns für eine Minute zur Verfügung. Weitere Informationen finden Sie unter CPU-Guthaben im Amazon-EC2-Entwicklerhandbuch. Diese Metrik ist nur für die T2-Instance-Typen verfügbar.

Relevante Statistiken: Minimum

OpenSearchDashboardsHealthyNodes

Ein Gesundheitscheck für OpenSearch Dashboards. Wenn Minimum, Maximum und Durchschnitt alle gleich 1 sind, verhalten sich Dashboards normal. Wenn Sie 10 Knoten mit einem Maximum von 1, Minimum von 0 und Durchschnitt von 0,7 haben, bedeutet dies, dass 7 Knoten (70 %) gesund und 3 Knoten (30 %) ungesund sind.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

OpensearchDashboardsReportingFailedRequestSysErrCount

Die Anzahl der Anfragen zur Generierung von OpenSearch Dashboard-Berichten, die aufgrund von Serverproblemen oder Funktionseinschränkungen fehlgeschlagen sind.

Relevante Statistiken: Summe

OpensearchDashboardsReportingFailedRequestUserErrCount

Die Anzahl der Anfragen zur Generierung von OpenSearch Dashboards-Berichten, die aufgrund von Client-Problemen fehlgeschlagen sind.

Relevante Statistiken: Summe

OpensearchDashboardsReportingRequestCount

Die Gesamtzahl der Anfragen zur Generierung von OpenSearch Dashboards-Berichten.

Relevante Statistiken: Summe

OpensearchDashboardsReportingSuccessCount

Die Anzahl der erfolgreichen Anfragen zur Generierung von OpenSearch Dashboard-Berichten.

Relevante Statistiken: Summe

KMSKeyError

Ein Wert von 1 gibt an, dass der AWS KMS Schlüssel, der zum Verschlüsseln von Daten im Ruhezustand verwendet wird, deaktiviert wurde. Aktivieren Sie den Schlüssel wieder, um den normalen Betrieb für die Domain wiederherzustellen. In der Konsole wird diese Metrik nur für Domains angezeigt, in denen Daten im Ruhezustand verschlüsselt werden.

Relevante Statistiken: Minimum, Maximum

KMSKeyInaccessible

Der Wert 1 gibt an, dass der AWS KMS Schlüssel, der zum Verschlüsseln von Daten im Ruhezustand verwendet wurde, gelöscht wurde oder dass seine Berechtigungen für den Dienst aufgehoben wurden. OpenSearch Für Domains, die sich in diesem Zustand befinden, ist die Wiederherstellung nicht möglich. Aber wenn Sie über einen manuellen Snapshot verfügen, können Sie diesen verwenden, um die Daten der Domain zu einer neuen Domain zu migrieren. In der Konsole wird diese Metrik nur für Domains angezeigt, in denen Daten im Ruhezustand verschlüsselt werden.

Relevante Statistiken: Minimum, Maximum

InvalidHostHeaderRequests

Die Anzahl der HTTP-Anfragen an den OpenSearch Cluster, die einen ungültigen (oder fehlenden) Host-Header enthielten. Gültige Anfragen enthalten den Domain-Hostnamen als Host-Header-Wert. OpenSearch Der Dienst lehnt ungültige Anfragen für Domänen mit öffentlichem Zugriff ab, für die es keine restriktive Zugriffsrichtlinie gibt. Wir empfehlen, auf alle Domains eine restriktive Zugriffsrichtlinie anzuwenden.

Wenn Sie große Werte für diese Metrik sehen, stellen Sie sicher, dass Ihre OpenSearch Kunden den Domain-Hostnamen (und nicht beispielsweise die IP-Adresse) in ihren Anfragen angeben.

Relevante Statistiken: Summe

OpenSearchRequests (previously ElasticsearchRequests)

Die Anzahl der Anfragen an den OpenSearch Cluster.

Relevante Statistiken: Summe

2xx, 3xx, 4xx, 5xx

Die Anzahl der Anforderungen an die Domain, die zum jeweiligen HTTP-Antwortcode (2xx, 3xx, 4xx, 5xx) geführt haben.

Relevante Statistiken: Summe

ThroughputThrottle

Gibt an, ob Festplatten gedrosselt wurden oder nicht. Eine Drosselung tritt auf, wenn der kombinierte Durchsatz von ReadThroughputMicroBursting und höher als der maximale Durchsatz, WriteThroughputMicroBursting ist. MaxProvisionedThroughput MaxProvisionedThroughputist der niedrigere Wert des Instanzdurchsatzes oder des bereitgestellten Volumendurchsatzes. Ein Wert von 1 gibt an, dass Festplatten gedrosselt wurden. Ein Wert von 0 zeigt ein normales Verhalten an.

Informationen zum Instance-Durchsatz finden Sie unter Amazon EBS-optimierte Instances. Informationen zum Volumendurchsatz finden Sie unter Amazon EBS-Volumetypen.

Relevante Statistiken: Minimum, Maximum

IopsThrottle

Gibt an, ob die Anzahl der Eingabe-/Ausgabevorgänge pro Sekunde (IOPS) in der Domain gedrosselt wurde. Eine Drosselung erfolgt, wenn die IOPS des Datenknotens die maximal zulässige Grenze des EBS-Volumes oder der EC2-Instance des Datenknotens überschreiten.

Informationen zu Instance-IOPS finden Sie unter Amazon EBS-optimierte Instances. Informationen zu Volume-IOPS finden Sie unter Amazon EBS-Volumetypen.

Relevante Statistiken: Minimum, Maximum

Dedizierte Hauptknoten-Metriken

Amazon OpenSearch Service bietet die folgenden Metriken für dedizierte Master-Knoten.

Metrik Beschreibung
MasterCPUUtilization

Der maximale Prozentsatz der CPU-Ressourcen, die von den dedizierten Hauptknoten verwendet werden. Wir empfehlen, die Größe des Instance-Typs zu erhöhen, wenn diese Metrik 60 Prozent erreicht.

Relevante Statistiken: Maximum

MasterFreeStorageSpace

Diese Metrik ist nicht relevant und kann ignoriert werden. Der Service verwendet keine Hauptknoten als Datenknoten.

MasterJVMMemoryPressure

Der maximale Prozentsatz des Java-Heap, der für alle dedizierten Hauptknoten im Cluster verwendet wird. Wir empfehlen die Verlagerung auf einen größeren Instance-Typen, wenn diese Metrik 85 Prozent erreicht.

Relevante Statistiken: Maximum

Anmerkung

Die Logik für diese Metrik wurde in der Service-Software R20220323 geändert. Weitere Informationen finden Sie in den Versionshinweisen.

MasterOldGenJVMMemoryPressure

Der maximale Prozentsatz des Java-Heap pro Hauptknoten, der für die „alte Generation“ verwendet wird.

Relevante Statistiken: Maximum

MasterCPUCreditBalance

Das verbleibende CPU-Guthaben für die dedizierte Hauptknoten im Cluster. Ein CPU-Guthaben stellt die Leistung eines gesamten CPU-Kerns für eine Minute zur Verfügung. Weitere Informationen finden Sie unter CPU-Guthaben im Amazon-EC2-Entwicklerhandbuch. Diese Metrik ist nur für die T2-Instance-Typen verfügbar.

Relevante Statistiken: Minimum

MasterReachableFromNode

Eine Zustandsprüfung für MasterNotDiscovered-Ausnahmen. Ein Wert von 1 zeigt ein normales Verhalten an. Ein Wert von 0 zeigt an, dass /_cluster/health/ fehlschlägt.

Ausfälle bedeuten, dass der Master-Knoten vom Quellknoten aus nicht erreichbar ist. Sie sind normalerweise das Ergebnis eines Problems mit der Netzwerkkonnektivität oder eines AWS Abhängigkeitsproblems.

Relevante Statistiken: Maximum

MasterSysMemoryUtilization

Der Prozentsatz des Arbeitsspeichers des Hauptknotens, der verwendet wird.

Relevante Statistiken: Maximum

EBS-Volume-Metriken

Amazon OpenSearch Service bietet die folgenden Metriken für EBS-Volumes.

Metrik Beschreibung
ReadLatency

Die Latenz für Lesevorgänge auf EBS-Volumes in Sekunden. Diese Metrik ist auch für einzelne Knoten verfügbar.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

WriteLatency

Die Latenz für Schreibvorgänge auf EBS-Volumes in Sekunden. Diese Metrik ist auch für einzelne Knoten verfügbar.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

ReadThroughput

Der Durchsatz für Lesevorgänge auf EBS-Volumes in Byte pro Sekunde. Diese Metrik ist auch für einzelne Knoten verfügbar.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

ReadThroughputMicroBursting

Der Durchsatz in Byte pro Sekunde für Lesevorgänge auf EBS-Volumes, wenn Micro-Bursting berücksichtigt wird. Diese Metrik ist auch für einzelne Knoten verfügbar. Micro-Bursting tritt auf, wenn ein EBS-Volume hohe IOPS- oder Durchsatzraten für deutlich kürzere Zeiträume (weniger als eine Minute) aufweist.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

WriteThroughput

Der Durchsatz für Schreibvorgänge auf EBS-Volumes in Byte pro Sekunde. Diese Metrik ist auch für einzelne Knoten verfügbar.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

WriteThroughputMicroBursting

Der Durchsatz in Byte pro Sekunde für Schreibvorgänge auf EBS-Volumes, wenn Micro-Bursting berücksichtigt wird. Diese Metrik ist auch für einzelne Knoten verfügbar. Micro-Bursting tritt auf, wenn ein EBS-Volume hohe IOPS- oder Durchsatzraten für deutlich kürzere Zeiträume (weniger als eine Minute) aufweist.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

DiskQueueDepth

Die Anzahl der ausstehenden Eingabe- und Ausgabe(I/O)-Anforderungen für ein EBS-Volume.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

ReadIOPS

Die Anzahl der Eingabe- und Ausgabe(I/O)-Vorgänge pro Sekunde für Lesevorgänge in EBS-Volumes. Diese Metrik ist auch für einzelne Knoten verfügbar.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

ReadIOPSMicroBursting

Die Anzahl der Eingabe- und Ausgabevorgänge (I/O) pro Sekunde für Lesevorgänge auf EBS-Volumes, wenn Micro-Bursting berücksichtigt wird. Diese Metrik ist auch für einzelne Knoten verfügbar. Micro-Bursting tritt auf, wenn ein EBS-Volume hohe IOPS- oder Durchsatzraten für deutlich kürzere Zeiträume (weniger als eine Minute) überbrückt.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

WriteIOPS

Die Anzahl der Eingabe- und Ausgabe(I/O)-Vorgänge pro Sekunde für Schreibvorgänge in EBS-Volumes. Diese Metrik ist auch für einzelne Knoten verfügbar.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

WriteIOPSMicroBursting

Die Anzahl der Eingabe- und Ausgabevorgänge (I/O) pro Sekunde für Schreibvorgänge auf EBS-Volumes, wenn Micro-Bursting berücksichtigt wird. Diese Metrik ist auch für einzelne Knoten verfügbar. Micro-Bursting tritt auf, wenn ein EBS-Volume hohe IOPS- oder Durchsatzraten für deutlich kürzere Zeiträume (weniger als eine Minute) übertrifft.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

BurstBalance

Der Prozentsatz der Ein- und Ausgabe (E/A)-Guthaben, die im Burst-Bucket für ein EBS-Volume verbleiben. Ein Wert von 100 bedeutet, dass das Volumen die maximale Anzahl von Credits erreicht hat. Wenn dieser Prozentsatz unter 70 % fällt, lesen Sie Niedrige EBS-Burst-Balance. Das Burst-Balance bleibt für Domains mit GP3-Volume-Typen und Domains mit GP2-Volumes mit einer Volume-Größe von über 1.000 GiB bei 0.

Relevante Statistiken: Minimum, Maximum, Durchschnitt

Instance-Metriken

Amazon OpenSearch Service bietet die folgenden Metriken für jede Instance in einer Domain. OpenSearch Service aggregiert diese Instance-Metriken auch, um einen Einblick in den allgemeinen Zustand des Clusters zu erhalten. Sie können dieses Verhalten mithilfe der Statistik über Beispielzähler in der Konsole überprüfen. Beachten Sie, dass jede Metrik in der folgenden Tabelle relevante Statistiken für den Knoten und den Cluster enthält.

Wichtig

Verschiedene Versionen von Elasticsearch nutzen unterschiedliche Threadpools für die Verarbeitung von Aufrufen der _index-API. Elasticsearch 1.5 und 2.3 nutzen den Index-Threadpool. Elasticsearch 5. x, 6.0 und 6.2 verwenden den Bulk-Thread-Pool. OpenSearch und Elasticsearch 6.3 und höher verwenden den Write-Thread-Pool. Derzeit enthält die OpenSearch Service-Konsole kein Diagramm für den Bulk-Thread-Pool.

Verwenden Sie GET _cluster/settings?include_defaults=true, um die Thread-Pool- und Warteschlangengrößen für Ihren Cluster zu überprüfen.

Metrik Beschreibung
ConcurrentSearchRate

Die Gesamtzahl der Suchanfragen mit gleichzeitiger Segmentsuche pro Minute für alle Shards auf einem Datenknoten. Eine einzelner Aufruf der _search-API gibt möglicherweise Ergebnisse von vielen unterschiedlichen Shards zurück. Befinden sich fünf dieser Shards in einem Knoten, meldet der Knoten für diese Metrik 5, auch wenn der Client nur eine Anfrage durchgeführt hat.

Relevante Statistiken für Knoten: Durchschnitt

Relevante Statistiken für Cluster: Durchschnitt, Maximum, Summe

ConcurrentSearchLatency

Der Unterschied in der Gesamtzeit in Millisekunden, die bei allen Suchen mit gleichzeitiger Segmentsuche in einem Knoten zwischen Minute N und Minute (N-1) benötigt wird.

Relevante Statistiken für Knoten: Durchschnitt

Relevante Statistiken für Cluster: Durchschnitt, Maximum

IndexingLatency

Die Differenz in Millisekunden in der Gesamtzeit aller Indizierungsvorgänge in einem Knoten zwischen Minute N und Minute (N-1).

Relevante Statistiken für Knoten: Durchschnitt

Relevante Statistiken für Cluster: Durchschnitt, Maximum

IndexingRate

Die Anzahl der Indizierungsvorgänge pro Minute. Ein einzelner Aufruf der _bulk-API, der zwei Dokumente und zwei Aktualisierungen hinzufügt, zählt als vier Vorgänge, die auf mehrere Knoten verteilt werden können. Wenn dieser Index über ein oder mehrere Replikate verfügt und sich auf einer OpenSearch Domain ohne optimierte Instances befindet, zeichnen andere Knoten im Cluster ebenfalls insgesamt vier Indizierungsvorgänge auf. Bei OpenSearch Domänen mit optimierten Instanzen zeichnen andere Knoten mit Replikaten keine Vorgänge auf. Löschungen von Dokumenten werden bei dieser Metrik nicht gezählt.

Relevante Statistiken für Knoten: Durchschnitt

Relevante Statistiken für Cluster: Durchschnitt, Maximum, Summe

SearchLatency

Der Unterschied in der Gesamtzeit in Millisekunden, die bei allen Suchen in einem Knoten zwischen Minute N und Minute (N-1) benötigt wird.

Relevante Statistiken für Knoten: Durchschnitt

Relevante Statistiken für Cluster: Durchschnitt, Maximum

SearchRate

Die Gesamtanzahl von Suchabfragen pro Minute für alle Shards in einem Datenknoten. Eine einzelner Aufruf der _search-API gibt möglicherweise Ergebnisse von vielen unterschiedlichen Shards zurück. Befinden sich fünf dieser Shards in einem Knoten, meldet der Knoten für diese Metrik 5, auch wenn der Client nur eine Anfrage durchgeführt hat.

Relevante Statistiken für Knoten: Durchschnitt

Relevante Statistiken für Cluster: Durchschnitt, Maximum, Summe

SegmentCount

Die Anzahl der Segmente auf einem Datenknoten. Je mehr Segmente Sie haben, desto länger dauert jede Suche. OpenSearch führt gelegentlich kleinere Segmente zu einem größeren zusammen.

Relevante Statistiken für Knoten: Maximum, Durchschnitt

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

SysMemoryUtilization

Der Prozentsatz des Arbeitsspeichers einer Instance, die in dem Cluster verwendet wird. Hohe Werte für diese Metrik sind normal und stellen normalerweise kein Problem mit Ihrem Cluster dar. Einen besseren Indikator für potenzielle Leistungs- und Stabilitätsprobleme finden Sie in der JVMMemoryPressure-Metrik.

Relevante Statistiken für Knoten: Minimum, Maximum, Durchschnitt

Relevante Statistiken für Cluster: Minimum, Maximum, Durchschnitt

JVMGCYoungCollectionCount

Die Anzahl der Ausführungen der automatischen Speicherbereinigung (Garbage Collection) "young generation". Eine stets zunehmende große Anzahl von Ausführungen ist ein normaler Aspekt bei Clustervorgängen.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

JVMGCYoungCollectionTime

Die Dauer in Millisekunden, die ein Cluster für die Ausführungen der automatischen Speicherbereinigung (Garbage Collection) „young generation“ aufgewendet hat.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

JVMGCOldCollectionCount

Die Anzahl der Ausführungen der automatischen Speicherbereinigung (Garbage Collection) "old generation". In einem Cluster mit genügend Ressourcen sollte diese Zahl relativ klein bleiben und selten zunehmen.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

JVMGCOldCollectionTime

Die Dauer in Millisekunden, die ein Cluster für die Ausführungen der automatischen Speicherbereinigung (Garbage Collection) „old generation“ aufgewendet hat.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

OpenSearchDashboardsConcurrentConnections

Die Anzahl der aktiven gleichzeitigen Verbindungen zu OpenSearch Dashboards. Wenn diese Zahl konstant hoch ist, sollten Sie Ihren Cluster skalieren.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

OpenSearchDashboardsHealthyNode

Eine Zustandsprüfung für den einzelnen OpenSearch Dashboards-Knoten. Ein Wert von 1 zeigt ein normales Verhalten an. Ein Wert von 0 zeigt an, dass auf Dashboards nicht zugegriffen werden kann.

Relevante Statistiken für Knoten: Minimum

Relevante Statistiken für Cluster: Minimum, Maximum, Durchschnitt

OpenSearchDashboardsHeapTotal

Die Menge des den OpenSearch Dashboards zugewiesenen Heap-Speichers in MiB. Verschiedene EC2-Instance-Typen können sich auf die genaue Speicherzuweisung auswirken.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

OpenSearchDashboardsHeapUsed

Die absolute Menge an Heap-Speicher, die von OpenSearch Dashboards in MiB verwendet wird.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

OpenSearchDashboardsHeapUtilization

Der maximale Prozentsatz des verfügbaren Heap-Speichers, der von Dashboards verwendet wird. OpenSearch Erhöht dieser Wert über 80 %, erwägen Sie eine Skalierung Ihres Clusters.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Minimum, Maximum, Durchschnitt

OpenSearchDashboardsOS1MinuteLoad

Die durchschnittliche CPU-Last von einer Minute für Dashboards. OpenSearch Die CPU-Last sollte idealerweise unter 1,00 liegen. Während temporäre Spitzen in Ordnung sind, empfehlen wir, die Größe des Instance-Typs zu erhöhen, wenn diese Metrik konsistent über 1,00 liegt.

Relevante Statistiken für Knoten: Durchschnitt

Relevante Statistiken für Cluster: Durchschnitt, Maximum

OpenSearchDashboardsRequestTotal

Die Gesamtzahl der HTTP-Anfragen an OpenSearch Dashboards. Wenn Ihr System langsam ist oder eine hohe Anzahl von Dashboards-Anforderungen angezeigt wird, sollten Sie die Größe des Instance-Typs erhöhen.

Relevante Knoten-Statistiken: Summe

Relevante Statistiken für Cluster: Summe

OpenSearchDashboardsResponseTimesMaxInMillis

Die maximale Zeit in Millisekunden, die OpenSearch Dashboards benötigen, um auf eine Anfrage zu antworten. Wenn Anforderungen konsistent lange brauchen, bis Ergebnisse zurückgegeben werden, sollten Sie die Größe des Instance-Typs erhöhen.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Maximum, Durchschnitt

SearchTaskCancelled

Die Anzahl der Stornierungen von Koordinatorknoten.

Relevante Knoten-Statistiken: Summe

Relevante Statistiken für Cluster: Summe

SearchShardTaskCancelled

Die Anzahl der Stornierungen von Datenknoten.

Relevante Knoten-Statistiken: Summe

Relevante Cluster-Statistiken: Summe,

ThreadpoolForce_mergeQueue

Die maximale Anzahl von Aufgaben in einer Warteschlange im Threadpool erzwungener Zusammenführungen. Wenn die Größe der Warteschlange gleichbleibend hoch ist, erwägen Sie eine Skalierung Ihres Clusters.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

ThreadpoolForce_mergeRejected

Die Anzahl abgewiesener Aufgaben im Threadpool erzwungener Zusammenführungen. Wenn die Anzahl stätig wächst, erwägen Sie eine Skalierung Ihres Clusters.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe

ThreadpoolForce_mergeThreads

Die Größe des Threadpools erzwungener Zusammenführungen.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Durchschnitt, Summe

ThreadpoolIndexQueue

Die Anzahl von Aufgaben in einer Warteschlange im Index-Threadpool. Wenn die Größe der Warteschlange gleichbleibend hoch ist, erwägen Sie eine Skalierung Ihres Clusters. Die maximale Größe der Index-Warteschlange beträgt 200.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

ThreadpoolIndexRejected

Die Anzahl abgewiesener Aufgaben im Index-Threadpool. Wenn die Anzahl stätig wächst, erwägen Sie eine Skalierung Ihres Clusters.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe

ThreadpoolIndexThreads

Die Größe des Index-Threadpools.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Durchschnitt, Summe

ThreadpoolSearchQueue

Die Anzahl von Aufgaben in einer Warteschlange im Such-Threadpool. Wenn die Größe der Warteschlange gleichbleibend hoch ist, erwägen Sie eine Skalierung Ihres Clusters. Die maximale Größe der Such-Warteschlange beträgt 1.000.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

ThreadpoolSearchRejected

Die Anzahl abgewiesener Aufgaben im Such-Threadpool. Wenn die Anzahl stätig wächst, erwägen Sie eine Skalierung Ihres Clusters.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe

ThreadpoolSearchThreads

Die Größe des Such-Threadpools.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Durchschnitt, Summe

Threadpoolsql-workerQueue

Die Anzahl von Aufgaben in einer Warteschlange im SQL-Such-Threadpool. Wenn die Größe der Warteschlange gleichbleibend hoch ist, erwägen Sie eine Skalierung Ihres Clusters.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

Threadpoolsql-workerRejected

Die Anzahl abgewiesener Aufgaben im SQL-Such-Threadpool. Wenn die Anzahl stätig wächst, erwägen Sie eine Skalierung Ihres Clusters.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe

Threadpoolsql-workerThreads

Die Größe des SQL-Such-Threadpools.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Durchschnitt, Summe

ThreadpoolBulkQueue

Die Anzahl von Aufgaben in einer Warteschlange im Massen-Threadpool. Wenn die Größe der Warteschlange gleichbleibend hoch ist, erwägen Sie eine Skalierung Ihres Clusters.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

ThreadpoolBulkRejected

Die Anzahl abgewiesener Aufgaben im Massen-Threadpool. Wenn die Anzahl stätig wächst, erwägen Sie eine Skalierung Ihres Clusters.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe

ThreadpoolBulkThreads

Die Größe des Massen-Threadpools.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Durchschnitt, Summe

ThreadpoolIndexSearcherQueue

Die Anzahl der Aufgaben in der Warteschlange im Thread-Pool der Indexsuche.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

ThreadpoolIndexSearcherRejected

Die Anzahl der abgelehnten Aufgaben im Threadpool der Indexsuche.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe

ThreadpoolIndexSearcherThreads

Die Größe des Threadpools für die Indexsuche.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Durchschnitt, Summe

ThreadpoolWriteThreads

Die Größe des Schreib-Threadpools.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Durchschnitt, Summe

ThreadpoolWriteQueue

Die Anzahl von Aufgaben in einer Warteschlange im Schreib-Threadpool.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Durchschnitt, Summe

ThreadpoolWriteRejected

Die Anzahl abgewiesener Aufgaben im Schreib-Threadpool.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Durchschnitt, Summe

Anmerkung

Da die Standardgröße der Schreibwarteschlange in Version 7.1 von 200 auf 10000 erhöht wurde, ist diese Metrik nicht mehr der einzige Indikator für Ablehnungen durch OpenSearch Service. Verwenden Sie die CoordinatingWriteRejected, PrimaryWriteRejected und ReplicaWriteRejected-Metriken, um Ablehnungen in Version 7.1 und höher zu überwachen.

CoordinatingWriteRejected

Die Gesamtzahl der Ablehnungen erfolgte auf dem koordinierenden Knoten aufgrund des Indexierungsdrucks seit dem letzten OpenSearch Start des Serviceprozesses.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Durchschnitt, Summe

Diese Metrik ist in Version 7.1 und höher verfügbar.

PrimaryWriteRejected

Die Gesamtzahl der Ablehnungen auf den primären Shards ist auf den Indexierungsdruck seit dem letzten Start des Serviceprozesses zurückzuführen. OpenSearch

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Durchschnitt, Summe

Diese Metrik ist in Version 7.1 und höher verfügbar.

ReplicaWriteRejected

Die Gesamtzahl der Ablehnungen auf den Replikat-Shards ist auf den Indexierungsdruck seit dem letzten Start des Serviceprozesses zurückzuführen. OpenSearch

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Durchschnitt, Summe

Diese Metrik ist in Version 7.1 und höher verfügbar.

UltraWarm Metriken

Amazon OpenSearch Service bietet die folgenden Metriken für UltraWarmKnoten.

Metrik Beschreibung
WarmCPUUtilization

Der Prozentsatz der CPU-Auslastung für UltraWarm Knoten im Cluster. „Maximum“ zeigt den Knoten mit der höchsten CPU-Nutzung an. Der Durchschnitt steht für alle UltraWarm Knoten im Cluster. Diese Metrik ist auch für einzelne UltraWarm Knoten verfügbar.

Relevante Statistiken: Maximum, Durchschnitt

WarmFreeStorageSpace

Die Menge an Warm-Speicherplatz in MiB. Weil Amazon S3 anstelle von angeschlossenen Festplatten UltraWarm verwendet Sum wird, ist dies die einzig relevante Statistik. Sie müssen den Zeitraum bei einer Minute belassen, um einen korrekten Wert zu erhalten.

Relevante Statistiken: Summe

WarmSearchableDocuments

Die Gesamtzahl der durchsuchbaren Dokumente in allen Warm-Indizes im Cluster. Sie müssen den Zeitraum bei einer Minute belassen, um einen korrekten Wert zu erhalten.

Relevante Statistiken: Summe

WarmSearchLatency

Der Unterschied in der Gesamtzeit in Millisekunden für alle Suchanfragen UltraWarm zwischen Minute N und Minute (N-1).

Relevante Statistiken für Knoten: Durchschnitt

Relevante Statistiken für Cluster: Durchschnitt, Maximum

WarmSearchRate

Die Gesamtzahl der Suchanfragen pro Minute für alle Shards auf einem Knoten. UltraWarm Eine einzelner Aufruf der _search-API gibt möglicherweise Ergebnisse von vielen unterschiedlichen Shards zurück. Befinden sich fünf dieser Shards in einem Knoten, meldet der Knoten für diese Metrik 5, auch wenn der Client nur eine Anfrage durchgeführt hat.

Relevante Statistiken für Knoten: Durchschnitt

Relevante Statistiken für Cluster: Durchschnitt, Maximum, Summe

WarmStorageSpaceUtilization

Die Gesamtmenge an Warm-Speicherplatz, in MiB, die vom Cluster belegt wird.

Relevante Statistiken: Maximum

HotStorageSpaceUtilization

Die Gesamtmenge an „Hot Storage“-Speicherplatz, die vom Cluster belegt wird.

Relevante Statistiken: Maximum

WarmSysMemoryUtilization

Der Prozentsatz des Arbeitsspeichers des Warm-Knotens, der verwendet wird.

Relevante Statistiken: Maximum

HotToWarmMigrationQueueSize

Die Anzahl der Indizes, die derzeit darauf warten, vom Hot- zum Warm-Speicher zu migrieren.

Relevante Statistiken: Maximum

WarmToHotMigrationQueueSize

Die Anzahl der Indizes, die derzeit darauf warten, vom Warm zum Hot Storage zu migrieren.

Relevante Statistiken: Maximum

HotToWarmMigrationFailureCount

Die Gesamtzahl der fehlgeschlagenen Hot-zu-Warm-Migrationen.

Relevante Statistiken: Summe

HotToWarmMigrationForceMergeLatency

Die durchschnittliche Latenz der erzwungenen Verschmelzungsphase des Migrationsprozesses. Wenn diese Phase durchweg zu lange dauert, ziehen Sie in Betracht, index.ultrawarm.migration.force_merge.max_num_segments zu erhöhen.

Relevante Statistiken: Durchschnitt

HotToWarmMigrationSnapshotLatency

Die durchschnittliche Latenz der Snapshot-Phase des Migrationsprozesses. Wenn dieser Schritt konsistent zu lange dauert, stellen Sie sicher, dass die Shards entsprechend dimensioniert und im gesamten Cluster verteilt sind.

Relevante Statistiken: Durchschnitt

HotToWarmMigrationProcessingLatency

Die durchschnittliche Latenz erfolgreicher Hot-to-Warm-Migrationen, ohne die in der Warteschlange verbrachte Zeit. Dieser Wert ist die Summe der Zeit, die benötigt wird, um die Phasen Zusammenführung zu erzwingen, Snapshot und Shard-Verlagerung des Migrationsprozesses abzuschließen.

Relevante Statistiken: Durchschnitt

HotToWarmMigrationSuccessCount

Die Gesamtzahl der erfolgreichen Hot-zu-Warm-Migrationen.

Relevante Statistiken: Summe

HotToWarmMigrationSuccessLatency

Die durchschnittliche Latenz erfolgreicher Hot-to-Warm-Migrationen, mit der in der Warteschlange verbrachten Zeit.

Relevante Statistiken: Durchschnitt

WarmThreadpoolSearchThreads

Die Größe des UltraWarm Such-Thread-Pools.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Durchschnitt, Summe

WarmThreadpoolSearchRejected

Die Anzahl der abgelehnten Aufgaben im UltraWarm Such-Thread-Pool. Wenn diese Zahl kontinuierlich zunimmt, sollten Sie erwägen, weitere UltraWarm Knoten hinzuzufügen.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe

WarmThreadpoolSearchQueue Die Anzahl der Aufgaben in der Warteschlange im UltraWarm Such-Thread-Pool. Wenn die Warteschlangengröße konstant hoch ist, sollten Sie erwägen, weitere UltraWarm Knoten hinzuzufügen.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

WarmJVMMemoryPressure

Der maximale Prozentsatz des Java-Heaps, der für die UltraWarm Knoten verwendet wird.

Relevante Statistiken: Maximum

Anmerkung

Die Logik für diese Metrik wurde in der Service-Software R20220323 geändert. Weitere Informationen finden Sie in den Versionshinweisen.

WarmOldGenJVMMemoryPressure

Der maximale Prozentsatz des Java-Heaps, der für die „alte Generation“ pro UltraWarm Knoten verwendet wird.

Relevante Statistiken: Maximum

WarmJVMGCYoungCollectionCount

Gibt an, wie oft die Garbage-Collection der „jungen Generation“ auf UltraWarm Knoten ausgeführt wurde. Eine stets zunehmende große Anzahl von Ausführungen ist ein normaler Aspekt bei Clustervorgängen.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

WarmJVMGCYoungCollectionTime

Die Zeit in Millisekunden, die der Cluster mit der Garbage-Collection der „jungen Generation“ auf Knoten verbracht hat. UltraWarm

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

WarmJVMGCOldCollectionCount

Die Häufigkeit, mit der die Speicherbereinigung der „alten Generation“ auf Knoten ausgeführt wurde. UltraWarm In einem Cluster mit genügend Ressourcen sollte diese Zahl relativ klein bleiben und selten zunehmen.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

WarmConcurrentSearchRate

Die Gesamtzahl der Suchanfragen mit gleichzeitiger Segmentsuche pro Minute für alle Shards auf einem UltraWarm Knoten. Eine einzelner Aufruf der _search-API gibt möglicherweise Ergebnisse von vielen unterschiedlichen Shards zurück. Befinden sich fünf dieser Shards in einem Knoten, meldet der Knoten für diese Metrik 5, auch wenn der Client nur eine Anfrage durchgeführt hat.

Relevante Statistiken für Knoten: Durchschnitt

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

WarmConcurrentSearchLatency

Der Unterschied in der Gesamtzeit in Millisekunden, die bei allen Suchen mit gleichzeitiger Segmentsuche in einem UltraWarm Knoten zwischen Minute N und Minute (N-1) benötigt wird.

Relevante Statistiken für Knoten: Durchschnitt

Relevante Statistiken für Cluster: Maximum, Durchschnitt

WarmThreadpoolIndexSearcherQueue

Die Anzahl der Aufgaben in der Warteschlange im Threadpool der Indexsuche. UltraWarm

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe, Maximum, Durchschnitt

WarmThreadpoolIndexSearcherRejected

Die Anzahl der abgelehnten Aufgaben im Threadpool der UltraWarm Indexsuche.

Relevante Statistiken für Knoten: Maximum

Relevante Statistiken für Cluster: Summe

WarmThreadpoolIndexSearcherThreads

Die Größe des Threadpools für die UltraWarm Indexsuche.

Relevante Statistiken für Knoten: Maximum

Relevante Cluster-Statistiken: Summe, Durchschnitt

Cold-Storage-Metriken

Amazon OpenSearch Service bietet die folgenden Kennzahlen für Cold Storage.

Metrik Beschreibung
ColdStorageSpaceUtilization

Die Gesamtmenge an Cold-Storage-Platz, in MiB, die vom Cluster belegt wird.

Relevante Statistiken: Maximum

ColdToWarmMigrationFailureCount

Die Gesamtzahl der fehlgeschlagenen Cold-zu-Warm-Migrationen.

Relevante Statistiken: Summe

ColdToWarmMigrationLatency

Die Zeitspanne für erfolgreiche Cold-zu-Warm-Migrationen.

Relevante Statistiken: Durchschnitt

ColdToWarmMigrationQueueSize

Die Anzahl der Indizes, die derzeit darauf warten, vom Cold- zum Warm-Speicher zu migrieren.

Relevante Statistiken: Maximum

ColdToWarmMigrationSuccessCount

Die Gesamtzahl der erfolgreichen Cold-zu-Warm-Migrationen.

Relevante Statistiken: Summe

WarmToColdMigrationFailureCount

Die Gesamtzahl der fehlgeschlagenen Warm-zu-Cold-Migrationen.

Relevante Statistiken: Summe

WarmToColdMigrationLatency

Die Zeitspanne für erfolgreiche Warm-zu-Cold-Migrationen.

Relevante Statistiken: Durchschnitt

WarmToColdMigrationQueueSize

Die Anzahl der Indizes, die derzeit darauf warten, vom Warm zum Cold Storage zu migrieren.

Relevante Statistiken: Maximum

WarmToColdMigrationSuccessCount

Die Gesamtzahl der erfolgreichen Warm-zu-Cold-Migrationen.

Relevante Statistiken: Summe

OR1-Metriken

Amazon OpenSearch Service bietet die folgenden Metriken für OR1-Instances.

Metrik Beschreibung
RemoteStorageUsedSpace

Die Gesamtmenge an Amazon S3 S3-Speicherplatz in MiB, die der Cluster verwendet.

Relevante Statistiken: Summe

RemoteStorageWriteRejected

Die Gesamtzahl der Anfragen, die aufgrund von Remote-Speicher- und Replikationsdruck auf primären Shards abgelehnt wurden. Dies wird ab dem letzten Start des OpenSearch Serviceprozesses berechnet.

Relevante Statistiken: Summe

Warnungsmetriken

Amazon OpenSearch Service bietet die folgenden Metriken für Benachrichtigungen.

Metrik Beschreibung
AlertingDegraded

Ein Wert von 1 bedeutet, dass entweder der Warnungsindex rot ist, oder ein oder mehrere Knoten nicht im Zeitplan sind. Ein Wert von 0 zeigt ein normales Verhalten an.

Relevante Statistiken: Maximum

AlertingIndexExists

Ein Wert von 1 bedeutet, dass der .opensearch-alerting-config-Index existiert. Ein Wert von 0 bedeutet, dass dies nicht der Fall ist. Bis Sie die Warnfunktion zum ersten Mal verwenden, bleibt dieser Wert bei 0.

Relevante Statistiken: Maximum

AlertingIndexStatus.green

Der Zustand des Index. Ein Wert von 1 bedeutet „grün“. Der Wert 0 bedeutet, dass der Index entweder nicht existiert oder nicht grün ist.

Relevante Statistiken: Maximum

AlertingIndexStatus.red

Der Zustand des Index. Ein Wert von 1 bedeutet „rot“. Der Wert 0 bedeutet, dass der Index entweder nicht existiert oder nicht rot ist.

Relevante Statistiken: Maximum

AlertingIndexStatus.yellow

Der Zustand des Index. Ein Wert von 1 bedeutet „gelb“. Der Wert 0 bedeutet, dass der Index entweder nicht vorhanden ist oder nicht gelb ist.

Relevante Statistiken: Maximum

AlertingNodesNotOnSchedule

Ein Wert von 1 bedeutet, dass einige Aufgaben nicht termingerecht ausgeführt werden. Der Wert 0 bedeutet, dass alle Alarmaufgaben termingerecht ausgeführt werden (oder dass keine Alarmaufgaben vorhanden sind). Sehen Sie in der OpenSearch Service-Konsole nach oder stellen Sie eine _nodes/stats Anfrage, um festzustellen, ob Knoten eine hohe Ressourcenauslastung aufweisen.

Relevante Statistiken: Maximum

AlertingNodesOnSchedule

Ein Wert von 1 bedeutet, dass alle Alarmaufgaben termingerecht ausgeführt werden (oder dass keine Alarmaufgaben vorhanden sind). Der Wert 0 bedeutet, dass einige Aufgaben nicht termingerecht ausgeführt werden.

Relevante Statistiken: Maximum

AlertingScheduledJobEnabled

Der Wert 1 bedeutet, dass die opensearch.scheduled_jobs.enabled-Clustereinstellung „true“ ist. Der Wert 0 bedeutet, dass diese „false“ ist und geplante Aufgaben deaktiviert sind.

Relevante Statistiken: Maximum

Metriken zur Anomalieerkennung

Amazon OpenSearch Service bietet die folgenden Metriken für die Erkennung von Anomalien.

Metrik Beschreibung
ADPluginUnhealthy

Ein Wert von 1 bedeutet, dass das Plug-in zur Anomalieerkennung nicht ordnungsgemäß funktioniert, entweder wegen einer hohen Anzahl von Fehlern oder weil einer der Indizes, die es verwendet, rot ist. Ein Wert 0 gibt an, dass das Plug-in wie erwartet funktioniert.

Relevante Statistiken: Maximum

ADExecuteRequestCount

Die Anzahl der Anfragen zur Erkennung von Anomalien.

Relevante Statistiken: Summe

ADExecuteFailureCount

Die Anzahl der fehlgeschlagenen Anfragen zur Erkennung von Anomalien.

Relevante Statistiken: Summe

ADHCExecuteFailureCount

Die Anzahl der fehlgeschlagenen Anforderungen zum Erkennen von Anomalien für Detektoren mit hoher Kardinalität.

Relevante Statistiken: Summe

ADHCExecuteRequestCount

Die Anzahl der Anforderungen zum Erkennen von Anomalien für Detektoren mit hoher Kardinalität.

Relevante Statistiken: Summe

ADAnomalyResultsIndexStatusIndexExists

Ein Wert 1 bedeutet, dass der Index, auf den der .opensearch-anomaly-results-Alias verweist, vorhanden ist. Bis Sie die Funktion zur Anomalieerkennung zum ersten Mal verwenden, bleibt dieser Wert 0.

Relevante Statistiken: Maximum

ADAnomalyResultsIndexStatus.red

Ein Wert 1 bedeutet, dass der Index, auf den der .opensearch-anomaly-results-Alias zeigt, rot ist. Ein Wert von 0 bedeutet, dass dies nicht der Fall ist. Bis Sie die Funktion zur Anomalieerkennung zum ersten Mal verwenden, bleibt dieser Wert 0.

Relevante Statistiken: Maximum

ADAnomalyDetectorsIndexStatusIndexExists

Ein Wert von 1 bedeutet, dass der .opensearch-anomaly-detectors-Index existiert. Ein Wert von 0 bedeutet, dass dies nicht der Fall ist. Bis Sie die Funktion zur Anomalieerkennung zum ersten Mal verwenden, bleibt dieser Wert 0.

Relevante Statistiken: Maximum

ADAnomalyDetectorsIndexStatus.red

Ein Wert von 1 bedeutet, dass der .opensearch-anomaly-detectors-Index rot ist. Ein Wert von 0 bedeutet, dass dies nicht der Fall ist. Bis Sie die Funktion zur Anomalieerkennung zum ersten Mal verwenden, bleibt dieser Wert 0.

Relevante Statistiken: Maximum

ADModelsCheckpointIndexStatusIndexExists

Ein Wert von 1 bedeutet, dass der .opensearch-anomaly-checkpoints-Index existiert. Ein Wert von 0 bedeutet, dass dies nicht der Fall ist. Bis Sie die Funktion zur Anomalieerkennung zum ersten Mal verwenden, bleibt dieser Wert 0.

Relevante Statistiken: Maximum

ADModelsCheckpointIndexStatus.red

Ein Wert von 1 bedeutet, dass der .opensearch-anomaly-checkpoints-Index rot ist. Ein Wert von 0 bedeutet, dass dies nicht der Fall ist. Bis Sie die Funktion zur Anomalieerkennung zum ersten Mal verwenden, bleibt dieser Wert 0.

Relevante Statistiken: Maximum

Amazon OpenSearch Service bietet die folgenden Metriken für die asynchrone Suche.

Asynchrone Suchkoordinator-Knotenstatistik (pro Koordinator-Knoten)

Metrik Beschreibung
AsynchronousSearchSubmissionRate

Die Anzahl der asynchronen Suchen, die in der letzten Minute gesendet wurden.

AsynchronousSearchInitializedRate

Die Anzahl der asynchronen Suchen, die in der letzten Minute initialisiert wurden.

AsynchronousSearchRunningCurrent

Die Anzahl der derzeit ausgeführten asynchronen Suchen.

AsynchronousSearchCompletionRate

Die Anzahl der asynchronen Suchen, die in der letzten Minute erfolgreich beendet wurden.

AsynchronousSearchFailureRate

Die Anzahl der asynchronen Suchen, die in der letzten Minute beendet wurden und fehlgeschlagen sind.

AsynchronousSearchPersistRate

Die Anzahl der asynchronen Suchen, die in der letzten Minute beibehalten wurden.

AsynchronousSearchPersistFailedRate

Die Anzahl der asynchronen Suchen, deren Beibehaltung in der letzten Minute fehlgeschlagen ist.

AsynchronousSearchRejected

Die Gesamtzahl der seit der Knotenbetriebszeit abgelehnten asynchronen Suchen.

AsynchronousSearchCancelled

Die Gesamtzahl der seit der Knotenbetriebszeit abgebrochenen asynchronen Suchen.

AsynchronousSearchMaxRunningTime

Die Dauer der längsten asynchronen Suche auf einem Knoten in der letzten Minute.

Asynchrone Suchcluster-Statistiken

Metrik Beschreibung
AsynchronousSearchStoreHealth

Der Zustand des Speichers im anhaltenden Index (Rot/Nicht-Rot) in der letzten Minute.

AsynchronousSearchStoreSize

Die Größe des Systemindex über alle Shards in der letzten Minute.

AsynchronousSearchStoredResponseCount

Die Anzahl der gespeicherten Antworten im Systemindex in der letzten Minute.

Metriken automatisch abstimmen

Amazon OpenSearch Service bietet die folgenden Metriken für Auto-Tune.

Metrik Beschreibung
AutoTuneChangesHistoryHeapSize

Die Änderungshistorie in MiB für Werte zur Optimierung der Heap-Größe.

AutoTuneChangesHistoryJVMYoungGenArgs

Die Änderungshistorie für JVM-Argumente YongGen .

AutoTuneFailed

Ein boolescher Wert, der angibt, ob die Auto-Tune-Änderung fehlgeschlagen ist.

AutoTuneSucceeded

Ein boolescher Wert, der angibt, ob die Auto-Tune-Änderung erfolgreich war.

AutoTuneValue Der Änderungsverlauf der Warteschlange (Anzahl) und die Cache-Tunings ändern den Verlauf (in MiB) für unterbrechungsfreie Änderungen.

Multi-AZ mit Standby-Metriken

Amazon OpenSearch Service bietet die folgenden Metriken für Multi-AZ mit Standby.

Metriken auf Knotenebene für Datenknoten in aktiven Availability Zones

Metrik Beschreibung
CPUUtilization Der Prozentsatz der CPU-Nutzung für Datenknoten im Cluster. „Maximum“ zeigt den Knoten mit der höchsten CPU-Nutzung an. „Average“ (Durchschnitt) stellt alle Knoten im Cluster dar. Diese Metrik ist auch für einzelne Knoten verfügbar.
FreeStorageSpace

Der freie Platz für Datenknoten im Cluster. Sum zeigt den gesamten freien Speicherplatz für den Cluster an, Sie müssen jedoch den Zeitraum bei einer Minute belassen, um einen genauen Wert zu erhalten. Minimum und Maximum zeigen die Knoten mit dem wenigsten bzw. dem meisten freien Speicherplatz an. Diese Metrik ist auch für einzelne Knoten verfügbar. OpenSearch Der Service gibt eine ausClusterBlockException, wenn diese Metrik erreicht 0 ist. Zum Wiederherstellen müssen Sie entweder Indizes löschen, größere Instances hinzufügen oder EBS-basierten Speicher zu vorhandenen Instances hinzufügen. Weitere Informationen hierzu finden Sie unter Zu wenig verfügbarer Speicherplatz.

Die OpenSearch Servicekonsole zeigt diesen Wert in GiB an. Die CloudWatch Amazon-Konsole zeigt es in MiB an.

JVMMemoryPressure Der maximale Prozentsatz des Java-Heaps, der für alle Datenknoten im Cluster verwendet wird. OpenSearch Der Dienst verwendet die Hälfte des RAM einer Instanz für den Java-Heap, bis zu einer Heap-Größe von 32 GiB. Sie können Instances bis zu 64 GiB RAM vertikal skalieren. Dann können Sie eine horizontale Skalierung durchführen, indem Sie Instances hinzufügen. Siehe Empfohlene CloudWatch Alarme für Amazon OpenSearch Service.
SysMemoryUtilization Der Prozentsatz des Arbeitsspeichers einer Instance, die in dem Cluster verwendet wird. Hohe Werte für diese Metrik sind normal und stellen normalerweise kein Problem mit Ihrem Cluster dar. Einen besseren Indikator für potenzielle Leistungs- und Stabilitätsprobleme finden Sie in der JVMMemoryPressure-Metrik.
IndexingLatency

Der Unterschied zwischen Minute N und Minute (N-1) in Millisekunden in der Gesamtzeit aller Indizierungsvorgänge in einem Knoten.

IndexingRate Die Anzahl der Indizierungsvorgänge pro Minute.
SearchLatency

Der Unterschied in der Gesamtzeit in Millisekunden, die bei allen Suchvorgängen in einem Knoten zwischen Minute N und Minute (N-1) gemessen wird.

SearchRate Die Gesamtanzahl von Suchabfragen pro Minute für alle Shards in einem Datenknoten.
ThreadpoolSearchQueue Die Anzahl von Aufgaben in einer Warteschlange im Such-Threadpool. Wenn die Größe der Warteschlange gleichbleibend hoch ist, erwägen Sie eine Skalierung Ihres Clusters. Die maximale Größe der Such-Warteschlange beträgt 1.000.
ThreadpoolWriteQueue Die Anzahl von Aufgaben in einer Warteschlange im Schreib-Threadpool.
ThreadpoolSearchRejected

Die Anzahl abgewiesener Aufgaben im Such-Threadpool. Wenn die Anzahl stätig wächst, erwägen Sie eine Skalierung Ihres Clusters.

ThreadpoolWriteRejected Die Anzahl abgewiesener Aufgaben im Schreib-Threadpool.

Metriken auf Clusterebene für Cluster in aktiven Availability Zones

Metrik Beschreibung
DataNodes Die Gesamtzahl der aktiven Shards und Standby-Shards.
DataNodesShards.active Die Gesamtzahl der aktiven primären und Replikat-Shards.
DataNodesShards.unassigned

Die Anzahl der Shards, die Knoten im Cluster nicht zugeordnet sind.

DataNodesShards.initializing Die Anzahl der Shards, die derzeit initialisiert werden.
DataNodesShards.relocating Die Anzahl der Shards, die derzeit verschoben werden.

Metriken zur Rotation der Verfügbarkeits

WennActiveReads.Availability-Zone = 1, dann ist die Zone aktiv. WennActiveReads.Availability-Zone = 0, dann befindet sich die Zone im Standby-Modus.

Metriken zum aktuellen Zeitpunkt

Amazon OpenSearch Service bietet die folgenden Metriken für Point-in-Time-Suchen (PIT).

Statistiken zum PIT-Koordinatorknoten (pro Koordinatorknoten)

Metrik Beschreibung
CurrentPointInTime Die Anzahl der aktiven PIT-Suchkontexte im Knoten.
TotalPointInTime Die Anzahl der abgelaufenen PIT-Suchkontexte seit der Betriebszeit des Knotens.
AvgPointInTimeAliveTime Die durchschnittliche Verfügbarkeit von PIT-Suchkontexten seit der Betriebszeit des Knotens.
HasActivePointInTime Ein Wert von 1 gibt an, dass es seit der Verfügbarkeit des Knotens aktive PIT-Kontexte auf Knoten gibt. Ein Wert von 0 bedeutet, dass keine vorhanden sind.
HasUsedPointInTime Ein Wert von 1 gibt an, dass seit der Betriebszeit des Knotens abgelaufene PIT-Kontexte auf Knoten vorhanden sind. Ein Wert von 0 bedeutet, dass keine vorhanden sind.

SQL-Metriken

Amazon OpenSearch Service bietet die folgenden Metriken für die SQL-Unterstützung.

Metrik Beschreibung
SQLFailedRequestCountByCusErr

Die Anzahl der Anforderungen an die _sql-API, die aufgrund eines Clientproblems fehlgeschlagen sind. Beispielsweise kann eine Anforderung den HTTP-Statuscode 400 aufgrund eines IndexNotFoundException zurückgeben.

Relevante Statistiken: Summe

SQLFailedRequestCountBySysErr

Die Anzahl der Anforderungen an die _sql-API, die aufgrund eines Serverproblems oder einer Funktionseinschränkung fehlgeschlagen sind. Beispielsweise kann eine Anforderung den HTTP-Statuscode 503 aufgrund eines VerificationException zurückgeben.

Relevante Statistiken: Summe

SQLRequestCount

Die Anzahl der Anforderungen an die _sql-API.

Relevante Statistiken: Summe

SQLDefaultCursorRequestCount

Ähnlich wieSQLRequestCount, zählt aber nur Paginierungsanfragen.

Relevante Statistiken: Summe

SQLUnhealthy

Ein Wert von 1 gibt an, dass das SQL-Plug-In als Antwort auf bestimmte Anfragen 5 xx Antwortcodes zurückgibt oder ungültige Query-DSL an weitergibt. OpenSearch Andere Anfragen sollten weiterhin erfolgreich sein. Der Wert 0 zeigt an, dass keine aktuellen Fehler vorliegen. Wenn Sie einen dauerhaften Wert von 1 sehen, beheben Sie die Anforderungen, die Ihre Clients an das Plug-in stellen.

Relevante Statistiken: Maximum

k-NN-Metriken

Amazon OpenSearch Service umfasst die folgenden Metriken für das K-Nearest Neighbor (k-NN) -Plugin.

Metrik Beschreibung
KNNCacheCapacityReached

Metrik pro Knoten, ob die Cache-Kapazität erreicht wurde. Diese Metrik ist nur für die ungefähre k-NN-Suche relevant.

Relevante Statistiken: Maximum

KNNCircuitBreakerTriggered

Metrik pro Cluster, ob der Leistungsschalter ausgelöst wird. Wenn Knoten einen Wert von 1 für KNNCacheCapacityReached zurückgibt, wird dieser Wert auch 1 zurückgeben. Diese Metrik ist nur für die ungefähre k-NN-Suche relevant.

Relevante Statistiken: Maximum

KNNEvictionCount

Metrik pro Knoten für die Anzahl der Diagramme, die aufgrund von Speichereinschränkungen oder Leerlaufzeit aus dem Cache entfernt wurden. Explizite Bereinigungen, die aufgrund des Indexlöschens auftreten, werden nicht gezählt. Diese Metrik ist nur für die ungefähre k-NN-Suche relevant.

Relevante Statistiken: Summe

KNNGraphIndexErrors

Metrik pro Knoten für die Anzahl der Anforderungen, um das knn_vector-Feld eines Dokuments in ein Diagramm hinzufügen, das einen Fehler erzeugt hat.

Relevante Statistiken: Summe

KNNGraphIndexRequests

Metrik pro Knoten für die Anzahl der Anforderungen, um das knn_vector-Feld eines Dokuments in ein Diagramm hinzufügen.

Relevante Statistiken: Summe

KNNGraphMemoryUsage

Metrik pro Knoten für die aktuelle Cachegröße (Gesamtgröße aller Diagramme im Speicher) in Kilobyte. Diese Metrik ist nur für die ungefähre k-NN-Suche relevant.

Relevante Statistiken: Durchschnitt

KNNGraphQueryErrors

Metrik pro Knoten für die Anzahl der Diagrammabfragen, die einen Fehler verursacht haben.

Relevante Statistiken: Summe

KNNGraphQueryRequests

Metrik pro Knoten für die Anzahl der Diagrammabfragen.

Relevante Statistiken: Summe

KNNHitCount

Metrik pro Knoten für die Anzahl der Cache-Treffer. Ein Cache-Treffer tritt auf, wenn ein Benutzer ein Diagramm abfragt, das bereits in den Speicher geladen ist. Diese Metrik ist nur für die ungefähre k-NN-Suche relevant.

Relevante Statistiken: Summe

KNNLoadExceptionCount

Metrik pro Knoten für die Häufigkeit, mit der eine Ausnahme aufgetreten ist, während versucht wurde, ein Diagramm in den Cache zu laden. Diese Metrik ist nur für die ungefähre k-NN-Suche relevant.

Relevante Statistiken: Summe

KNNLoadSuccessCount

Metrik pro Knoten, wie oft das Plug-In ein Diagramm erfolgreich in den Cache geladen hat. Diese Metrik ist nur für die ungefähre k-NN-Suche relevant.

Relevante Statistiken: Summe

KNNMissCount

Metrik pro Knoten für die Anzahl der Cache-Fehlschläge. Ein Cache-Fehlschlag tritt auf, wenn ein Benutzer ein Diagramm abfragt, das noch nicht in den Speicher geladen ist. Diese Metrik ist nur für die ungefähre k-NN-Suche relevant.

Relevante Statistiken: Summe

KNNQueryRequests

Metrik pro Knoten für die Anzahl der Abfrageanforderungen, die das k–NN-Plug-In empfangen hat.

Relevante Statistiken: Summe

KNNScriptCompilationErrors

Metrik pro Knoten für die Anzahl der Fehler während der Skript-Kompilierung. Diese Statistik ist nur relevant für die Suche nach k-NN-Skripten.

Relevante Statistiken: Summe

KNNScriptCompilations

Metrik pro Knoten für die Anzahl der Kompilierung des k-NN-Skripts. Dieser Wert sollte normalerweise 1 oder 0 sein, aber wenn der Cache mit den kompilierten Skripten gefüllt ist, wird das k-NN-Skript möglicherweise neu kompiliert. Diese Statistik ist nur relevant für die Suche nach k-NN-Skripten.

Relevante Statistiken: Summe

KNNScriptQueryErrors

Metrik pro Knoten für die Anzahl der Fehler bei Skriptabfragen. Diese Statistik ist nur relevant für die Suche nach k-NN-Skripten.

Relevante Statistiken: Summe

KNNScriptQueryRequests

Metrik pro Knoten für die Gesamtzahl der Skriptabfragen. Diese Statistik ist nur relevant für die Suche nach k-NN-Skripten.

Relevante Statistiken: Summe

KNNTotalLoadTime

Die Zeit in Nanosekunden, die k-NN benötigt hat, um Diagramme in den Cache zu laden. Diese Metrik ist nur für die ungefähre k-NN-Suche relevant.

Relevante Statistiken: Summe

Amazon OpenSearch Service bietet die folgenden Metriken für die clusterübergreifende Suche.

Metriken der Quell-Domain

Metrik Dimension Beschreibung
CrossClusterOutboundConnections

ConnectionId

Anzahl der verbundenen Knoten. Wenn Ihre Antwort eine oder mehrere übersprungene Domains enthält, verwenden Sie diese Metrik, um alle fehlerhaften Verbindungen nachzuverfolgen. Wenn diese Zahl auf 0 fällt, ist die Verbindung fehlerhaft.

CrossClusterOutboundRequests

ConnectionId

Anzahl der an die Ziel-Domain gesendeten Suchabfragen. Verwenden Sie dies, um zu überprüfen, ob die Last von Cluster-übergreifenden Suchabfragen Ihre Domain überfordert, korrelieren Sie jede Spitze in dieser Metrik mit jeder JVM/CPU-Spitze.

Metrik der Ziel-Domain

Metrik Dimension Beschreibung
CrossClusterInboundRequests

ConnectionId

Anzahl der eingehenden Verbindungsanforderungen, die von der Quell-Domain empfangen wurden.

Fügen Sie einen CloudWatch Alarm für den Fall hinzu, dass Sie unerwartet eine Verbindung verlieren. Schritte zum Erstellen eines Alarms finden Sie unter Erstellen eines CloudWatch Alarms auf der Grundlage eines statischen Schwellenwerts.

Cluster-übergreifende Replikationsmetriken

Amazon OpenSearch Service bietet die folgenden Metriken für die clusterübergreifende Replikation.

Metrik Beschreibung
ReplicationRate

Die durchschnittliche Rate der Replikationsvorgänge pro Sekunde. Diese Metrik ähnelt der IndexingRate-Metrik.

LeaderCheckPoint

Die Summe der Leader-Checkpoint-Werte für eine bestimmte Verbindung über alle replizierenden Indizes. Sie können diese Metrik verwenden, um die Latenz der Replikation zu messen.

FollowerCheckPoint

Die Summe der Follower-Checkpoint-Werte für eine bestimmte Verbindung über alle replizierenden Indizes. Sie können diese Metrik verwenden, um die Latenz der Replikation zu messen.

ReplicationNumSyncingIndices

Die Anzahl der Indizes, die den Replikationsstatus SYNCING haben.

ReplicationNumBootstrappingIndices

Die Anzahl der Indizes, die den Replikationsstatus BOOTSTRAPPING haben.

ReplicationNumPausedIndices

Die Anzahl der Indizes, die den Replikationsstatus PAUSED haben.

ReplicationNumFailedIndices

Die Anzahl der Indizes, die den Replikationsstatus FAILED haben.

CrossClusterOutboundReplicationRequests

Die Anzahl der Replikationstransportanfragen auf der Follower-Domain. Transportanfragen sind intern und treten bei jedem Aufruf eines Replikations-API-Vorgangs auf. Sie treten auch auf, wenn die Follower-Domain Änderungen gegenüber der Leader-Domain abfragt.

CrossClusterInboundReplicationRequests

Die Anzahl der Replikationstransportanfragen in der Leader-Domäne. Transportanfragen sind intern und treten bei jedem Aufruf eines Replikations-API-Vorgangs auf.

AutoFollowNumSuccessStartReplication

Die Anzahl der Follower-Indizes, die durch eine Replikationsregel für eine bestimmte Verbindung erfolgreich erstellt wurden.

AutoFollowNumFailedStartReplication

Die Anzahl der Follower-Indizes, die von einer Replikationsregel nicht erstellt werden konnten, wenn ein übereinstimmendes Muster vorhanden war. Dieses Problem kann aufgrund eines Netzwerkproblems auf dem Remote-Cluster oder eines Sicherheitsproblems auftreten (d. h. die zugeordnete Rolle hat keine Berechtigung zum Starten der Replikation).

AutoFollowLeaderCallFailure

Ob es fehlgeschlagene Abfragen vom Follower-Index zum Leader-Index gegeben hat, um neue Daten abzurufen. Ein Wert von 1 bedeutet, dass es in der letzten Minute 1 oder mehr fehlgeschlagene Anrufe gegeben hat.

Learning-to-Rank-Metriken

Amazon OpenSearch Service bietet die folgenden Kennzahlen für Learning to Rank.

Metrik Beschreibung
LTRRequestTotalCount

Gesamtzahl der Ranglistenanforderungen.

LTRRequestErrorCount

Gesamtzahl der fehlgeschlagenen Anforderungen.

LTRStatus.red

Verfolgt, ob einer der Indizes, die zum Ausführen des Plug-Ins benötigt werden, rot ist.

LTRMemoryUsage

Der Gesamtspeicher, der vom Plug-In verwendet wird.

LTRFeatureMemoryUsageInBytes

Die Menge an Arbeitsspeicher in Byte, die von den Learning-to-Rank-Funktionsfeldern verwendet wird.

LTRFeaturesetMemoryUsageInBytes

Die Menge an Arbeitsspeicher in Byte, die von allen Learning-to-Rank-Funktionssets verwendet wird.

LTRModelMemoryUsageInBytes

Die Menge an Arbeitsspeicher in Byte, die von allen Learning-to-Rank-Modellen verwendet wird.

Metriken für Piped Processing Language

Amazon OpenSearch Service bietet die folgenden Metriken für Piped Processing Language.

Metrik Beschreibung
PPLFailedRequestCountByCusErr

Die Anzahl der Anforderungen an die _ppl-API, die aufgrund eines Clientproblems fehlgeschlagen sind. Beispielsweise kann eine Anforderung den HTTP-Statuscode 400 aufgrund eines IndexNotFoundException zurückgeben.

PPLFailedRequestCountBySysErr

Die Anzahl der Anforderungen an die _ppl-API, die aufgrund eines Serverproblems oder einer Funktionseinschränkung fehlgeschlagen sind. Beispielsweise kann eine Anforderung den HTTP-Statuscode 503 aufgrund eines VerificationException zurückgeben.

PPLRequestCount

Die Anzahl der Anforderungen an die _ppl-API.