Überwachen von Amazon Redshift mit CloudWatch-Metriken - Amazon Redshift

Überwachen von Amazon Redshift mit CloudWatch-Metriken

Mit CloudWatch-Metriken für Amazon Redshift können Sie Informationen über den Status und die Leistung Ihres Clusters abrufen und Informationen auf Knotenebene anzeigen. Bei der Arbeit mit diesen Metriken sollten Sie beachten, dass zu jeder Metrik eine oder mehrere Dimensionen gehören. Diese Dimensionen stellen Ihnen Informationen dazu bereit, worauf die Metrik angewendet werden kann, d. h. zum Geltungsumfang der Metrik. Amazon Redshift umfasst die folgenden beiden Dimensionen:

  • Metriken mit einer NodeID-Dimension bieten Leistungsdaten für die Knoten eines Clusters. Diese Gruppe von Metriken umfasst Leader- und die Datenverarbeitungsknoten. Beispiele für diese Metriken sind etwa CPUUtilization, ReadIOPS, WriteIOPS.

  • Metriken nur mit einer ClusterIdentifier-Dimension bieten Leistungsdaten für Cluster. Beispiele für diese Metriken sind etwa HealthStatus und MaintenanceMode.

    Anmerkung

    In einigen Fällen repräsentieren clusterspezifische Metriken eine Aggregierung des Knotenverhaltens. Interpretieren Sie diese Metrikwerte in diesen Fällen mit Vorsicht, da das Verhalten des Leader-Knotens mit dem des Datenverarbeitungsknotens aggregiert ist.

Allgemeine Informationen zu CloudWatch-Metriken und -Dimensionen finden Sie unter CloudWatch-Konzepte im Amazon-CloudWatch-Benutzerhandbuch.

Eine nähere Beschreibung von CloudWatch-Metriken für Amazon Redshift finden Sie in den folgenden Abschnitten.

Amazon-Redshift-Metriken

Der AWS/Redshift-Namespace enthält die folgenden Metriken. Sofern nicht anders angegeben, werden Metriken in 1-Minuten-Intervallen erfasst.

Titel
Metrik Beschreibung
CommitQueueLength

Die Anzahl der Transaktionen, die zu einem bestimmten Zeitpunkt darauf warten, einen Commit durchzuführen.

Einheiten: Anzahl

Maße: ClusterIdentifier

ConcurrencyScalingActiveClusters

Die Anzahl der Nebenläufigkeitsskalierungs-Cluster, die zu einem gegebenen Zeitpunkt aktiv Abfragen verarbeiten.

Einheiten: Anzahl

Maße: ClusterIdentifier

ConcurrencyScalingSeconds

Die von Nebenläufigkeitsskalierungs-Clustern, die aktiv Abfragen verarbeiten, genutzten Sekunden.

Einheiten: Summe

Maße: ClusterIdentifier

CPUUtilization

Prozentsatz der CPU-Auslastung. Für Cluster stellt diese Metrik eine Aggregierung der CPU-Auslastungswerte aller Knoten (Leader- und Datenverarbeitungsknoten) dar.

Einheiten: Prozent

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

DatabaseConnections

Die Anzahl der Datenbankverbindungen zu einem Cluster.

Einheiten: Anzahl

Maße: ClusterIdentifier

HealthStatus

Zeigt den Status des Clusters an. Der Cluster stellt jede Minute eine Verbindung zu seiner Datenbank her und führt eine einfache Abfrage aus. Kann dieser Vorgang erfolgreich ausgeführt werden, wird der Cluster als fehlerfrei eingestuft. Andernfalls ist der Cluster fehlerhaft. Ein fehlerhafter Status kann auftreten, wenn die Auslastung der Cluster-Datenbank sehr hoch ist, oder falls ein Konfigurationsproblem mit einer Datenbank auf dem Cluster vorliegt.

Anmerkung

In Amazon CloudWatch wird diese Metrik als 1 oder 0 gemeldet, wohingegen sie in der Amazon-Redshift-Konsole der Einfachheit halber mit HEALTHY oder UNHEALTHY angezeigt wird. Wenn diese Metrik in der Amazon-Redshift-Konsole angezeigt wird, werden Sampling-Durchschnittswerte ignoriert und es wird nur HEALTHY oder UNHEALTHY angezeigt. In Amazon CloudWatch können aufgrund von Sampling-Problemen andere Werte als 1 und 0 vorkommen. Jeder Wert unter 1 für HealthStatus wird als 0 (UNHEALTHY) berichtet.

Einheiten: Anzahl (1/0) (HEALTHY/UNHEALTHY in der Amazon-Redshift-Konsole)

Maße: ClusterIdentifier

MaintenanceMode

Gibt an, ob sich der Cluster im Wartungsmodus befindet.

Anmerkung

In Amazon CloudWatch wird diese Metrik als 1 oder 0 gemeldet, wohingegen sie in der Amazon-Redshift-Konsole der Einfachheit halber mit ON oder OFF angezeigt wird. Wenn diese Metrik in der Amazon-Redshift-Konsole angezeigt wird, werden Sampling-Durchschnittswerte ignoriert und es wird nur ON oder OFF angezeigt. In Amazon CloudWatch können aufgrund von Sampling-Problemen andere Werte als 1 und 0 vorkommen. Jeder Wert größer als 0 für MaintenanceMode wird als 1 (ON) berichtet.

Einheiten: Anzahl (1/0) (ON/OFF in der Amazon-Redshift-Konsole).

Maße: ClusterIdentifier

MaxConfiguredConcurrencyScalingClusters

Maximale Anzahl der Nebenläufigkeitsskalierungs-Cluster; von der Parametergruppe konfiguriert. Weitere Informationen finden Sie unter Amazon-Redshift-Parametergruppen.

Einheiten: Anzahl

Maße: ClusterIdentifier

NetworkReceiveThroughput

Die Rate, mit der der Knoten bzw. der Cluster Daten empfängt.

Einheiten: Byte/Sekunde (MB/s in der Amazon-Redshift-Konsole)

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

NetworkTransmitThroughput

Die Rate, mit der der Knoten bzw. der Cluster Daten schreibt.

Einheiten: Byte/Sekunde (MB/s in der Amazon-Redshift-Konsole)

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

PercentageDiskSpaceUsed

Der prozentuale Anteil des verwendeten Speicherplatzes.

Einheiten: Prozent

Maße: ClusterIdentifier

QueriesCompletedPerSecond

Durchschnittliche Anzahl der ausgeführten Abfragen pro Sekunde. Wird in 5-Minuten-Intervallen gemeldet.

Einheiten: Anzahl/Sekunde

Maße: ClusterIdentifier, latency

Maße: ClusterIdentifier, wlmid

QueryDuration

Die durchschnittliche Zeit, die es dauert, bis eine Abfrage ausgeführt wurde. Wird in 5-Minuten-Intervallen gemeldet.

Einheiten: Mikrosekunden

Dimensionen: ClusterIdentifier, NodeID, latency

Maße: ClusterIdentifier, latency

Dimensionen: ClusterIdentifier, NodeID, wlmid

QueryRuntimeBreakdown

Die Gesamtzeit; die Abfragen in der Abfragestufe verbracht haben. Wird in 5-Minuten-Intervallen gemeldet.

Einheiten: Millisekunden

Dimensionen: ClusterIdentifier, NodeID, Stufe

Dimensionen: ClusterIdentifier, Stufe

ReadIOPS

Durchschnittliche Anzahl der Lesevorgänge pro Sekunde.

Einheiten: Anzahl/Sekunde

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

ReadLatency

Die durchschnittliche Dauer für I/O-Lesevorgänge.

Einheiten: Sekunden

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

ReadThroughput

Die durchschnittliche Anzahl Byte, die pro Sekunde vom Datenträger gelesen werden

Einheiten: Byte (GB/s in der Amazon-Redshift-Konsole)

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

TotalTableCount

Die Anzahl der zu einem bestimmten Zeitpunkt geöffneten Benutzertabellen. Diese Summe enthält keine Amazon-Redshift-Spectrum-Tabellen.

Einheiten: Anzahl

Maße: ClusterIdentifier

WLMQueueLength

Die Anzahl der Abfragen, die auf die Aufnahme, in eine Workload-Management-Warteschlange (WLM-Queue) aufgenommen zu werden, warten.

Einheiten: Anzahl

Maße: ClusterIdentifier, service class

Maße: ClusterIdentifier, QueueName

WLMQueueWaitTime

Für das Warten in einer WLM-Warteschlange (Workload Management) aufgewendete Gesamtzeit. Wird in 5-Minuten-Intervallen gemeldet.

Einheiten: Millisekunden

Maße: ClusterIdentifier, QueryPriority

Maße: ClusterIdentifier, wlmid

Maße: ClusterIdentifier, QueueName

WLMQueriesCompletedPerSecond

Die durchschnittliche Anzahl der ausgeführten Abfragen pro Sekunde für eine Workload Management (WLM)-Warteschlange. Wird in 5-Minuten-Intervallen gemeldet.

Einheiten: Anzahl/Sekunde

Maße: ClusterIdentifier, wlmid

Maße: ClusterIdentifier, QueueName

WLMQueryDuration

Die durchschnittliche Zeitdauer zum Abschließen einer Abfrage für eine Workload Management (WLM)-Warteschlange. Wird in 5-Minuten-Intervallen gemeldet.

Einheiten: Mikrosekunden

Maße: ClusterIdentifier, wlmid

Maße: ClusterIdentifier, QueueName

WLMRunningQueries

Die Anzahl der Abfragen, die vom Haupt-Cluster und vom Nebenläufigkeitsskalierungs-Cluster pro WLM-Warteschlange ausgeführt werden.

Einheiten: Anzahl

Maße: ClusterIdentifier, wlmid

Maße: ClusterIdentifier, QueueName

WriteIOPS

Durchschnittliche Anzahl der Schreibvorgänge pro Sekunde.

Einheiten: Anzahl/Sekunde

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

WriteLatency

Die durchschnittliche Dauer für I/O-Schreibvorgänge.

Einheiten: Sekunden

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

WriteThroughput

Die durchschnittliche Anzahl von Bytes, die pro Sekunde auf den Datenträger geschrieben werden.

Einheiten: Byte (GB/s in der Amazon-Redshift-Konsole)

Maße: ClusterIdentifier, NodeID

Maße: ClusterIdentifier

SchemaQuota

Das konfigurierte Kontingent für ein Schema.

Einheiten: Megabyte

Dimensionen: ClusterIdentifier, DatabaseName, SchemaName

Periodisch/Push: Periodic

Häufigkeit: 5 minutes

Stopp-Kriterien: Schema gelöscht oder Kontingent entfernt

NumExceededSchemaQuotas

Die Anzahl der Schemata mit überschrittenen Kontingenten.

Einheiten: Anzahl

Maße: ClusterIdentifier

Periodisch/Push: Periodic

Häufigkeit: 5 minutes

Stopp-Kriterium: k. A.

StorageUsed

Der Datenträger oder Speicherplatz, der von einem Schema genutzt wird.

Einheiten: Megabyte

Dimensionen: ClusterIdentifier, DatabaseName, SchemaName

Periodisch/Push: Periodic

Häufigkeit: 5 minutes

Stopp-Kriterien: Schema gelöscht oder Kontingent entfernt

PercentageQuotaUsed

Der Prozentsatz des genutzten Datenträgers oder Speicherplatzes im Verhältnis zum konfigurierten Schemakontingent.

Einheiten: Prozent

Dimensionen: ClusterIdentifier, DatabaseName, SchemaName

Periodisch/Push: Periodic

Häufigkeit: 5 minutes

Stopp-Kriterien: Schema gelöscht oder Kontingent entfernt

Dimensionen für Amazon Redshift-Metriken

Amazon-Redshift-Daten können nach einer der in der folgenden Tabelle aufgeführten Dimensionen gefiltert werden.

Dimension Beschreibung
latency

Die möglichen Werte lauten wie folgt:

  • kurz – unter 10 Sekunden

  • mittel – zwischen 10 Sekunden und 10 Minuten

  • lang – über 10 Minuten

NodeID

Filtert angeforderte Daten, die für die Knoten eines Clusters spezifisch sind. NodeID ist entweder „Leader“, „Shared“ oder „Compute-N“, wobei N gleich 0, 1 ... entsprechend der Anzahl der Knoten im Cluster ist. "Shared" bedeutet, dass das Cluster nur über einen Knoten verfügt, d. h., dass der Führungs- und der Datenverarbeitungsknoten kombiniert sind.

Für Leader- und Datenverarbeitungsknoten werden Metriken nur für CPUUtilization, NetworkTransmitThroughput und ReadIOPS berichtet. Andere Metriken, die die NodeId-Dimension verwenden, werden nur für Datenverarbeitungsknoten gemeldet.

ClusterIdentifier

Filtert angeforderte Daten, die für den Cluster spezifisch sind. Cluster-spezifische Metriken beinhalten HealthStatus, MaintenanceMode und DatabaseConnections. Allgemeine Metriken für diese Dimension (z. B. ReadIOPS), die auch Knotenmetriken sind, stellen den Gesamtwert der Knotenmetrikdaten dar. Berücksichtigen Sie bei der Interpretation dieser Metriken den Umstand, dass sie das Gesamtverhalten der Führungs- und Datenverarbeitungsknoten darstellen.

service class

Die ID für eine WLM-Service-Klasse.

stage

Die Ausführungsstufen einer Abfrage. Die möglichen Werte lauten wie folgt:

  • QueryPlanning: Für die Analyse und Optimierung der SQL-Anweisungen aufgewendete Zeit.

  • QueryWaiting: Für das Warten in einer WLM-Warteschlange aufgewendete Zeit.

  • QueryExecutingRead: Für die Ausführung von Leseabfragen aufgewendete Zeit.

  • QueryExecutingInsert: Für die Ausführung von Einfügungsabfragen aufgewendete Zeit.

  • QueryExecutingDelete: Für die Ausführung von Löschabfragen aufgewendete Zeit.

  • QueryExecutingUpdate: Für die Ausführung von Aktualisierungsabfragen aufgewendete Zeit.

  • QueryExecutingCtas: Für die Ausführung von Abfragen zum Erstellen einer Tabelle aufgewendete Zeit.

  • QueryExecutingUnload: Für die Ausführung von Entladeabfragen aufgewendete Zeit.

  • QueryExecutingCopy: Für die Ausführung von Kopierabfragen aufgewendete Zeit.

  • QueryCommit: Für das Commit aufgewendete Zeit.

wlmid

Der Bezeichner für eine Workload Management-Warteschlange.

QueryPriority

Die Priorität der Abfrage. Mögliche Werte sind CRITICAL, HIGHEST, HIGH, NORMAL, LOW und LOWEST.

QueueName

Der Name der Workload Management-Warteschlange.

Abfrage- und Ladeleistungsdaten von Amazon Redshift

Zusätzlich zu den CloudWatch-Metriken bietet Amazon Redshift Abfrage- und Ladeleistungsdaten. Abfrage- und Lade-Leistungsdaten helfen Ihnen beim Verständnis des Verhältnis zwischen der Datenbankleistung und den Cluster-Metriken. Zum Beispiel: Wenn Sie erkennen, dass die CPU-Nutzung eines Clusters einen Spitzenwert zeigt, finden Sie diesen Wert auf dem CPU-Graph des Clusters und können die Abfragen identifizieren, die zu diesem Zeitpunkt ausgeführt wurden. Wenn Sie andererseits eine bestimmte Abfrage untersuchen, finden Sie die Metrikdaten (etwa die CPU-Nutzung) in ihrem Kontext angezeigt, so dass Sie die Auswirkungen der Abfrage auf die Cluster-Metriken verstehen können-

Abfrage- und Ladeleistungsdaten werden nicht als CloudWatch-Metriken veröffentlicht und können nur in der Amazon-Redshift-Konsole angezeigt werden. Abfrage- und Ladeleistungsdaten werden aus der Abfrage mit den Systemtabellen Ihrer Datenbank generiert (weitere Informationen finden Sie unter Systemtabellenreferenz im Amazon-Redshift-Entwicklerhandbuch). Sie können auch Ihre eigenen benutzerdefinierten Leistungsabfragen generieren, wir empfehlen jedoch, mit den in der Konsole präsentierten Abfrage- und Lade-Leistungsdaten zu beginnen. Weitere Informationen dazu, wie Sie die Leistung Ihrer Datenbank selbst messen und überwachen können, finden Sie unter Verwalten der Leistung im Amazon-Redshift-Entwicklerhandbuch.

Die folgende Tabelle beschreibt die verschiedenen Aspekte der Abfrage- und Ladedaten, auf die Sie in der Amazon-Redshift-Konsole zugreifen können.

Abfrage-/Ladedaten Beschreibung
Abfragezusammenfassung

Eine Liste der Abfragen in einem angegebenen Zeitraum. Die Liste kann nach Werten wie Abfrage-ID, Abfragelaufzeit und Status sortiert werden. Zeigen Sie diese Daten auf der Registerkarte Query monitoring (Abfrageüberwachung) der Cluster-Detailseite an.

Abfragedetails

Bietet Details zu einer bestimmten Abfrage, darunter:

  • Abfrageeigenschaften, wie etwa Abfrage-ID, Typ, Cluster, auf dem die Abfrage ausgeführt wurde und Laufzeit.

  • Details wie Status der Abfrage und Zahl der Fehler.

  • Die ausgeführte SQL-Anweisung.

  • Falls verfügbar, ein Erläuterungsplan.

  • Cluster-Leistungsdaten während der Abfrageausführung (weitere Informationen finden Sie unter Anzeigen der Abfrageverlaufsdaten).

Lade-Zusammenfassung

Listet alle Ladevorgänge in dem angegebenen Zeitraum auf. Die Liste kann nach Werten wie Abfrage-ID, Abfragelaufzeit und Status sortiert werden. Zeigen Sie diese Daten auf der Registerkarte Query monitoring (Abfrageüberwachung) der Cluster-Detailseite an.

Lade-Details

Bietet Details zu einer bestimmten Ladeoperation, darunter:

  • Lade-Eigenschaften, wie etwa Abfrage-ID, Typ, Cluster, auf dem die Abfrage ausgeführt wurde und Laufzeit.

  • Details wie Status des Ladevorgangs und Zahl der Fehler.

  • Die ausgeführte SQL-Anweisung.

  • Eine Liste der geladenen Dateien.

  • Cluster-Leistungsdaten während des Ladevorgangs (weitere Informationen finden Sie unter Anzeigen der Abfrageverlaufsdaten).