Überwachung von Amazon Redshift mithilfe von Metriken CloudWatch - Amazon Redshift

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachung von Amazon Redshift mithilfe von Metriken CloudWatch

Mithilfe von CloudWatch Metriken für Amazon Redshift können Sie Informationen über den Zustand und die Leistung Ihres Clusters abrufen und Informationen auf Knotenebene einsehen. Bei der Arbeit mit diesen Metriken sollten Sie beachten, dass zu jeder Metrik eine oder mehrere Dimensionen gehören. Diese Dimensionen stellen Ihnen Informationen dazu bereit, worauf die Metrik angewendet werden kann, d. h. zum Geltungsumfang der Metrik. Amazon Redshift umfasst die folgenden beiden Dimensionen:

  • Metriken mit einer NodeID-Dimension bieten Leistungsdaten für die Knoten eines Clusters. Diese Gruppe von Metriken umfasst Leader- und die Datenverarbeitungsknoten. Beispiele für diese Metriken sind etwa CPUUtilization, ReadIOPS, WriteIOPS.

  • Metriken nur mit einer ClusterIdentifier-Dimension bieten Leistungsdaten für Cluster. Beispiele für diese Metriken sind etwa HealthStatus und MaintenanceMode.

    Anmerkung

    In einigen Fällen repräsentieren clusterspezifische Metriken eine Aggregierung des Knotenverhaltens. Interpretieren Sie diese Metrikwerte in diesen Fällen mit Vorsicht, da das Verhalten des Leader-Knotens mit dem des Datenverarbeitungsknotens aggregiert ist.

Allgemeine Informationen zu CloudWatch Metriken und Dimensionen finden Sie unter CloudWatch Konzepte im CloudWatch Amazon-Benutzerhandbuch.

Eine weitere Beschreibung der CloudWatch Metriken für Amazon Redshift finden Sie in den folgenden Abschnitten.

Amazon-Redshift-Metriken

Der AWS/Redshift-Namespace enthält die folgenden Metriken. Sofern nicht anders angegeben, werden Metriken in 1-Minuten-Intervallen erfasst.

Title
Metrik Beschreibung
CommitQueueLength

Die Anzahl der Transaktionen, die zu einem bestimmten Zeitpunkt darauf warten, einen Commit durchzuführen.

Einheiten: Anzahl

Maße: ClusterIdentifier

ConcurrencyScalingActiveClusters

Die Anzahl der Nebenläufigkeitsskalierungs-Cluster, die zu einem gegebenen Zeitpunkt aktiv Abfragen verarbeiten.

Einheiten: Anzahl

Maße: ClusterIdentifier

ConcurrencyScalingSeconds

Die von Nebenläufigkeitsskalierungs-Clustern, die aktiv Abfragen verarbeiten, genutzten Sekunden.

Einheiten: Anzahl

Maße: ClusterIdentifier

CPUUtilization

Der Prozentsatz der CPU Nutzung. Bei Clustern stellt diese Metrik eine Aggregation aller CPU Auslastungswerte für Knoten (Leader und Compute) dar.

Einheiten: Prozent

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

DatabaseConnections

Die Anzahl der Datenbankverbindungen zu einem Cluster.

Einheiten: Anzahl

Maße: ClusterIdentifier

HealthStatus

Zeigt den Status des Clusters an. Der Cluster stellt jede Minute eine Verbindung zu seiner Datenbank her und führt eine einfache Abfrage aus. Kann dieser Vorgang erfolgreich ausgeführt werden, wird der Cluster als fehlerfrei eingestuft. Andernfalls ist der Cluster fehlerhaft. Ein fehlerhafter Status kann auftreten, wenn die Auslastung der Cluster-Datenbank sehr hoch ist, oder falls ein Konfigurationsproblem mit einer Datenbank auf dem Cluster vorliegt.

Anmerkung

In Amazon wird diese Metrik als 1 oder 0 gemeldet CloudWatch, wohingegen diese Metrik in der Amazon Redshift Redshift-Konsole der Einfachheit UNHEALTHY halber mit den Worten HEALTHY oder angezeigt wird. Wenn diese Metrik in der Amazon-Redshift-Konsole angezeigt wird, werden Sampling-Durchschnittswerte ignoriert und es wird nur HEALTHY oder UNHEALTHY angezeigt. Bei Amazon CloudWatch können aufgrund eines Stichprobenproblems andere Werte als 1 und 0 auftreten. Jeder Wert unter 1 für HealthStatus wird als 0 (UNHEALTHY) berichtet.

Einheiten: Anzahl (1/0) (HEALTHY/UNHEALTHY in der Amazon-Redshift-Konsole)

Maße: ClusterIdentifier

MaintenanceMode

Gibt an, ob sich der Cluster im Wartungsmodus befindet.

Anmerkung

In Amazon wird diese Metrik als 1 oder 0 gemeldet CloudWatch, wohingegen diese Metrik in der Amazon Redshift Redshift-Konsole der Einfachheit OFF halber mit den Worten ON oder angezeigt wird. Wenn diese Metrik in der Amazon-Redshift-Konsole angezeigt wird, werden Sampling-Durchschnittswerte ignoriert und es wird nur ON oder OFF angezeigt. Bei Amazon CloudWatch können aufgrund von Stichprobenproblemen andere Werte als 1 und 0 auftreten. Jeder Wert größer als 0 für MaintenanceMode wird als 1 (ON) berichtet.

Einheiten: Anzahl (1/0) (ON/OFF in der Amazon-Redshift-Konsole).

Maße: ClusterIdentifier

MaxConfiguredConcurrencyScalingClusters

Maximale Anzahl der Nebenläufigkeitsskalierungs-Cluster; von der Parametergruppe konfiguriert. Weitere Informationen finden Sie unter Amazon-Redshift-Parametergruppen.

Einheiten: Anzahl

Maße: ClusterIdentifier

NetworkReceiveThroughput

Die Rate, mit der der Knoten bzw. der Cluster Daten empfängt.

Einheiten: Byte/Sekunde (MB/s in der Amazon-Redshift-Konsole)

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

NetworkTransmitThroughput

Die Rate, mit der der Knoten bzw. der Cluster Daten schreibt.

Einheiten: Byte/Sekunde (MB/s in der Amazon-Redshift-Konsole)

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

PercentageDiskSpaceUsed

Der prozentuale Anteil des verwendeten Speicherplatzes.

Einheiten: Prozent

Maße: ClusterIdentifier

Maße: ClusterIdentifier, NodeID

QueriesCompletedPerSecond

Durchschnittliche Anzahl der ausgeführten Abfragen pro Sekunde. Wird in 5-Minuten-Intervallen gemeldet. Diese Metrik wird auf Clustern mit einem Knoten nicht unterstützt.

Einheiten: Anzahl/Sekunde

Maße: ClusterIdentifier, latency

Maße: ClusterIdentifier, wlmid

QueryDuration

Die durchschnittliche Zeit, die es dauert, bis eine Abfrage ausgeführt wurde. Wird in 5-Minuten-Intervallen gemeldet. Diese Metrik wird auf Clustern mit einem Knoten nicht unterstützt.

Einheiten: Mikrosekunden

Dimensionen: ClusterIdentifier, NodeID, latency

Maße: ClusterIdentifier, latency

Dimensionen: ClusterIdentifier, NodeID, wlmid

QueryRuntimeBreakdown

Die Gesamtzeit; die Abfragen in der Abfragestufe verbracht haben. Wird in 5-Minuten-Intervallen gemeldet.

Einheiten: Millisekunden

Abmessungen: ClusterIdentifier, NodeID, Stage

Abmessungen: ClusterIdentifier, Bühne

ReadIOPS

Durchschnittliche Anzahl der Lesevorgänge pro Sekunde.

Einheiten: Anzahl/Sekunde

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

ReadLatency

Die durchschnittliche Dauer für I/O-Lesevorgänge.

Einheiten: Sekunden

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

ReadThroughput

Die durchschnittliche Anzahl Byte, die pro Sekunde vom Datenträger gelesen werden.

Einheiten: Byte (GB/s in der Amazon-Redshift-Konsole)

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

RedshiftManagedStorageTotalCapacity

Gesamte verwaltete Speicherkapazität

Einheiten: Megabyte

Maße: ClusterIdentifier

TotalTableCount

Die Anzahl der zu einem bestimmten Zeitpunkt geöffneten Benutzertabellen. Diese Summe enthält keine Amazon-Redshift-Spectrum-Tabellen.

Einheiten: Anzahl

Maße: ClusterIdentifier

WLMQueueLength

Die Anzahl der Abfragen, die darauf warten, in eine Workload-Management-Warteschlange (WLM) aufgenommen zu werden.

Einheiten: Anzahl

Maße: ClusterIdentifier, service class

Maße: ClusterIdentifier, QueueName

WLMQueueWaitTime

Die Gesamtzeit, die Abfragen in der Workload-Management-Warteschlange (WLM) warteten. Wird in 5-Minuten-Intervallen gemeldet.

Einheiten: Millisekunden

Maße: ClusterIdentifier, QueryPriority

Maße: ClusterIdentifier, wlmid

Maße: ClusterIdentifier, QueueName

WLMQueriesCompletedPerSecond

Die durchschnittliche Anzahl abgeschlossener Abfragen pro Sekunde für eine Workload-Management-Warteschlange (WLM). Wird in 5-Minuten-Intervallen gemeldet. Diese Metrik wird auf Clustern mit einem Knoten nicht unterstützt.

Einheiten: Anzahl/Sekunde

Maße: ClusterIdentifier, wlmid

Maße: ClusterIdentifier, QueueName

WLMQueryDuration

Die durchschnittliche Zeit, die benötigt wird, um eine Abfrage für eine Workload-Management-Warteschlange (WLM) abzuschließen. Wird in 5-Minuten-Intervallen gemeldet. Diese Metrik wird auf Clustern mit einem Knoten nicht unterstützt.

Einheiten: Mikrosekunden

Maße: ClusterIdentifier, wlmid

Maße: ClusterIdentifier, QueueName

WLMRunningQueries

Die Anzahl der Abfragen, die sowohl vom Hauptcluster als auch vom Parallelitätsskalierungscluster pro WLM Warteschlange ausgeführt werden.

Einheiten: Anzahl

Maße: ClusterIdentifier, wlmid

Maße: ClusterIdentifier, QueueName

WriteIOPS

Durchschnittliche Anzahl der Schreibvorgänge pro Sekunde.

Einheiten: Anzahl/Sekunde

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

WriteLatency

Die durchschnittliche Dauer für I/O-Schreibvorgänge.

Einheiten: Sekunden

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

WriteThroughput

Die durchschnittliche Anzahl von Bytes, die pro Sekunde auf den Datenträger geschrieben werden.

Einheiten: Byte (GB/s in der Amazon-Redshift-Konsole)

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

SchemaQuota

Das konfigurierte Kontingent für ein Schema.

Einheiten: Megabyte

Dimensionen: ClusterIdentifier, Database, Schema

Periodisch/Push: Periodic

Häufigkeit: 5 minutes

Stopp-Kriterien: Schema gelöscht oder Kontingent entfernt

NumExceededSchemaQuotas

Die Anzahl der Schemata mit überschrittenen Kontingenten.

Einheiten: Anzahl

Maße: ClusterIdentifier

Periodisch/Push: Periodic

Häufigkeit: 5 minutes

Stopp-Kriterium: k. A.

StorageUsed

Der Datenträger oder Speicherplatz, der von einem Schema genutzt wird.

Einheiten: Megabyte

Dimensionen: ClusterIdentifier, Database, Schema

Periodisch/Push: Periodic

Häufigkeit: 5 minutes

Stopp-Kriterien: Schema gelöscht oder Kontingent entfernt

PercentageQuotaUsed

Der Prozentsatz des genutzten Datenträgers oder Speicherplatzes im Verhältnis zum konfigurierten Schemakontingent.

Einheiten: Prozent

Dimensionen: ClusterIdentifier, Database, Schema

Periodisch/Push: Periodic

Häufigkeit: 5 minutes

Stopp-Kriterien: Schema gelöscht oder Kontingent entfernt

UsageLimitAvailable

Gibt je nach Folgendes UsageLimitAvailable zurück: FeatureType

  • Wenn jaCONCURRENCY_SCALING, FeatureType wird die Gesamtzeit UsageLimitAvailable zurückgegeben, die für die Parallelitätsskalierung in 1-Minuten-Schritten genutzt werden kann.

  • Wenn jaCROSS_REGION_DATASHARING, FeatureType wird die Gesamtmenge der Daten UsageLimitAvailable zurückgegeben, die in Schritten von 1 TB gescannt werden können.

  • Wenn jaSPECTRUM, FeatureType wird die Gesamtmenge der Daten UsageLimitAvailable zurückgegeben, die in Schritten von 1 TB gescannt werden können.

Einheiten: Minuten oder TBs

Dimensionen: ClusterIdentifier, FeatureType, UsageLimitId

UsageLimitConsumed

Gibt je FeatureType nach Folgendes UsageLimitConsumed zurück:

  • Wenn jaCONCURRENCY_SCALING, FeatureType wird die Gesamtzeit, die für die Parallelitätsskalierung verwendet wurde, in Schritten von 1 Minute UsageLimitAvailable zurückgegeben.

  • Wenn jaCROSS_REGION_DATASHARING, FeatureType wird die Gesamtmenge der gescannten Daten in Schritten von 1 TB UsageLimitAvailable zurückgegeben.

  • Wenn jaSPECTRUM, FeatureType wird die Gesamtmenge der gescannten Daten in Schritten von 1 TB UsageLimitAvailable zurückgegeben.

Einheiten: Minuten oder TBs

Dimensionen: ClusterIdentifier, FeatureType, UsageLimitId

Dimensionen für Amazon Redshift-Metriken

Amazon-Redshift-Daten können nach einer der in der folgenden Tabelle aufgeführten Dimensionen gefiltert werden.

Dimension Beschreibung
latency

Die möglichen Werte lauten wie folgt:

  • kurz – unter 10 Sekunden

  • mittel – zwischen 10 Sekunden und 10 Minuten

  • lang – über 10 Minuten

NodeID

Filtert angeforderte Daten, die für die Knoten eines Clusters spezifisch sind. NodeID ist entweder „Leader“, „Shared“ oder „Compute-N“, wobei N gleich 0, 1 ... entsprechend der Anzahl der Knoten im Cluster ist. "Shared" bedeutet, dass das Cluster nur über einen Knoten verfügt, d. h., dass der Führungs- und der Datenverarbeitungsknoten kombiniert sind.

Für Leader- und Datenverarbeitungsknoten werden Metriken nur für CPUUtilization, NetworkTransmitThroughput und ReadIOPS berichtet. Andere Metriken, die die NodeId-Dimension verwenden, werden nur für Datenverarbeitungsknoten gemeldet.

ClusterIdentifier

Filtert angeforderte Daten, die für den Cluster spezifisch sind. Cluster-spezifische Metriken beinhalten HealthStatus, MaintenanceMode und DatabaseConnections. Allgemeine Metriken für diese Dimension (z. B. ReadIOPS), die auch Knotenmetriken sind, stellen den Gesamtwert der Knotenmetrikdaten dar. Berücksichtigen Sie bei der Interpretation dieser Metriken den Umstand, dass sie das Gesamtverhalten der Führungs- und Datenverarbeitungsknoten darstellen.

service class

Die ID für eine WLM-Service-Klasse.

stage

Die Ausführungsstufen einer Abfrage. Die möglichen Werte lauten wie folgt:

  • QueryPlanning: Zeit, die für das Analysieren und Optimieren von SQL Anweisungen aufgewendet wurde.

  • QueryWaiting: Wartezeit in der WLM Warteschlange.

  • QueryExecutingRead: Zeit, die für die Ausführung von Leseabfragen aufgewendet wurde.

  • QueryExecutingInsert: Zeit, die für die Ausführung von Insert-Abfragen aufgewendet wurde.

  • QueryExecutingDelete: Zeit, die für die Ausführung von Löschabfragen aufgewendet wurde.

  • QueryExecutingUpdate: Zeit, die mit der Ausführung von Aktualisierungsabfragen verbracht wurde.

  • QueryExecutingCtas: Zeit, die für die Ausführung von Abfragen zum Erstellen von Tabellen als Abfragen aufgewendet wurde.

  • QueryExecutingUnload: Zeit, die für die Ausführung von Entladeabfragen aufgewendet wurde.

  • QueryExecutingCopy: Zeit, die für die Ausführung von Kopieranfragen aufgewendet wurde.

  • QueryCommit: Zeit, die für das Festschreiben aufgewendet wurde.

wlmid

Der Bezeichner für eine Workload Management-Warteschlange.

QueryPriority

Die Priorität der Abfrage. Mögliche Werte sind CRITICAL, HIGHEST, HIGH, NORMAL, LOW und LOWEST.

QueueName

Der Name der Workload Management-Warteschlange.

FeatureType

Das Feature, das durch eine Nutzungsbeschränkung eingeschränkt ist. Mögliche Werte sind CONCURRENCY_SCALING, CROSS_REGION_DATASHARING und SPECTRUM.

UsageLimitId

Der Bezeichner für ein Nutzungslimit.

Abfrage- und Ladeleistungsdaten von Amazon Redshift

Zusätzlich zu den CloudWatch Metriken stellt Amazon Redshift Daten zur Abfrage- und Ladeleistung bereit. Abfrage- und Lade-Leistungsdaten helfen Ihnen beim Verständnis des Verhältnis zwischen der Datenbankleistung und den Cluster-Metriken. Wenn Sie beispielsweise feststellen, dass ein Cluster Spitzenwerte CPU aufweist, können Sie die Spitze im CPU Cluster-Diagramm finden und sehen, welche Abfragen zu diesem Zeitpunkt ausgeführt wurden. Wenn Sie dagegen eine bestimmte Abfrage überprüfen, werden Metrikdaten (likeCPU) im Kontext angezeigt, sodass Sie die Auswirkungen der Abfrage auf die Cluster-Metriken nachvollziehen können.

Abfrage- und Ladeleistungsdaten werden nicht als CloudWatch Metriken veröffentlicht und können nur in der Amazon Redshift Redshift-Konsole angezeigt werden. Abfrage- und Ladeleistungsdaten werden aus der Abfrage mit den Systemtabellen Ihrer Datenbank generiert (weitere Informationen finden Sie unter Systemtabellenreferenz im Amazon-Redshift-Entwicklerhandbuch). Sie können auch Ihre eigenen benutzerdefinierten Leistungsabfragen generieren, wir empfehlen jedoch, mit den in der Konsole präsentierten Abfrage- und Lade-Leistungsdaten zu beginnen. Weitere Informationen dazu, wie Sie die Leistung Ihrer Datenbank selbst messen und überwachen können, finden Sie unter Verwalten der Leistung im Amazon-Redshift-Entwicklerhandbuch.

Die folgende Tabelle beschreibt die verschiedenen Aspekte der Abfrage- und Ladedaten, auf die Sie in der Amazon-Redshift-Konsole zugreifen können.

Abfrage-/Ladedaten Beschreibung
Abfragezusammenfassung

Eine Liste der Abfragen in einem angegebenen Zeitraum. Die Liste kann nach Werten wie Abfrage-ID, Abfragelaufzeit und Status sortiert werden. Zeigen Sie diese Daten auf der Registerkarte Query monitoring (Abfrageüberwachung) der Cluster-Detailseite an.

Abfragedetails

Bietet Details zu einer bestimmten Abfrage, darunter:

  • Abfrageeigenschaften, wie etwa Abfrage-ID, Typ, Cluster, auf dem die Abfrage ausgeführt wurde und Laufzeit.

  • Details wie Status der Abfrage und Zahl der Fehler.

  • Die SQL Anweisung, die ausgeführt wurde.

  • Falls verfügbar, ein Erläuterungsplan.

  • Cluster-Leistungsdaten während der Abfrageausführung (weitere Informationen finden Sie unter Anzeigen der Abfrageverlaufsdaten).

Lade-Zusammenfassung

Listet alle Ladevorgänge in dem angegebenen Zeitraum auf. Die Liste kann nach Werten wie Abfrage-ID, Abfragelaufzeit und Status sortiert werden. Zeigen Sie diese Daten auf der Registerkarte Query monitoring (Abfrageüberwachung) der Cluster-Detailseite an.

Lade-Details

Bietet Details zu einer bestimmten Ladeoperation, darunter:

  • Lade-Eigenschaften, wie etwa Abfrage-ID, Typ, Cluster, auf dem die Abfrage ausgeführt wurde und Laufzeit.

  • Details wie Status des Ladevorgangs und Zahl der Fehler.

  • Die SQL Anweisung, die ausgeführt wurde.

  • Eine Liste der geladenen Dateien.

  • Cluster-Leistungsdaten während des Ladevorgangs (weitere Informationen finden Sie unter Anzeigen der Abfrageverlaufsdaten).