Anzeigen von Cluster-Leistungsdaten - Amazon Redshift

Anzeigen von Cluster-Leistungsdaten

Mithilfe von Cluster-Metriken in Amazon Redshift können Sie die folgenden gängigen Leistungsaufgaben durchführen:

  • Feststellung, ob die Clustermetriken in einem bestimmten Zeitraum abnorm sind und, falls dies der Fall ist, Identifizierung der Abfragen, die dafür verantwortlich sind.

  • Prüfung, ob sich frühere oder aktuelle Abfragen auf die Clusterleistung auswirken. Wenn Sie eine problematische Abfrage identifizieren, können Sie Einzelheiten dazu anzeigen, einschließlich der Clusterleistung während der Ausführung der Abfrage. Diese Informationen können Ihnen dabei helfen, herauszufinden, warum die Abfrage langsam durchgeführt wurde, und was Sie tun können, um ihre Leistung zu verbessern.

Anmerkung

Für Amazon Redshift ist eine neue Konsole verfügbar. Wählen Sie je nach verwendeter Konsole eine der Anweisungen New console (Neue Konsole) oder Original console (Ursprüngliche Konsole) aus. Standardmäßig wird die Anweisung New Console (Neue Konsole) geöffnet.

So zeigen Sie Leistungsdaten an:

  1. Melden Sie sich bei der AWS Management Console an und öffnen Sie die Amazon-Redshift-Konsole unter https://console.aws.amazon.com/redshift/.

  2. Wählen Sie im Navigationsmenü CLUSTERS (CLUSTER) und dann den Namen eines Clusters aus der Liste aus, um seine Details zu öffnen. Die Details des Clusters werden angezeigt, u. a. einschließlich der Registerkarten Cluster performance (Cluster-Leistung), Query monitoring (Abfrageüberwachung), Databases (Datenbanken), Datashares, Schedules (Zeitpläne), Maintenance (Wartung) und Properties (Eigenschaften).

  3. Wählen Sie die Registerkarte Cluster performance (Cluster-Leistung) für Leistungsinformationen, einschließlich der folgenden, aus:

    • CPU-Auslastung

    • Percentage disk space used (Prozentualer Festplattenspeicherverbrauch)

    • Datenbankverbindungen

    • Gesundheitsstatus

    • Query duration (Abfragedauer)

    • Query throughput (Abfrage Durchsatz)

    • Concurrency scaling activity (Parallelitätsskalierungsaktivität)

    Viele weitere Metriken sind verfügbar. Um die verfügbaren Metriken anzuzeigen und die angezeigten auszuwählen, wählen Sie das Preferences (Präferenzen)-Symbol aus.

Die Standard-Clusteransicht zeigt alle Knoten auf einem Graphen, eine Average-Statistik sowie Daten für die letzte Stunde. Sie können diese Ansicht nach Bedarf ändern. Einige Metriken, wie etwa HealthStatus, gelten nur für den Leader-Knoten, während andere, wie etwa WriteOps, nur für Datenverarbeitungsknoten gelten. Beim Wechsel des Knoten-Anzeigemodus werden alle Filter zurückgesetzt.

So zeigen Sie Cluster-Leistungsdaten an:

  1. Melden Sie sich bei der AWS Management Console an und öffnen Sie die Amazon-Redshift-Konsole unter https://console.aws.amazon.com/redshift/.

  2. Klicken Sie im Navigationsbereich auf Clusters (Cluster).

  3. Wählen Sie für Cluster (Cluster) das Lupensymbol neben dem Cluster aus, dessen Leistungsdaten Sie anzeigen möchten.

  4. Wählen Sie die Registerkarte Performance (Leistung) aus.

    Standardmäßig zeigt die Leistungsansicht die Clusterleistung der letzten Stunde an. Zur Optimierung der Ansicht stehen Filter zur Verfügung, die Sie wie in der nachfolgenden Tabelle beschrieben verwenden können.

    Aktion Verwenden Sie diesen Filter.
    Ändern des Zeitraums, für den Daten angezeigt werden Wählen Sie aus der Liste Time Range (Zeitraum) einen Zeitraum aus. Standardmäßig wird die letzte Stunde angezeigt.
    Ändern der Periode, für die Daten angezeigt werden

    Wählen Sie aus der Liste Period (Periode) eine Periode aus. Standardmäßig wird eine Periode von fünf Minuten angezeigt. Verwenden Sie eine Periode unter fünf Minuten, wenn Sie bei der Untersuchung der Metrik mehr Details benötigen (Drilling in) und Metriken für einen insgesamt kleinen Zeitraum, etwa zehn Minuten, anzeigen möchten. Verwenden Sie eine Periode über fünf Minuten, wenn Sie Metriken über einen längeren Zeitraum hinweg, etwa mehrere Tage, anzeigen.

    Ändern der für Metriken angezeigten Statistiken

    Wählen Sie aus der Liste Statistic (Statistik) eine Statistik aus. Standardmäßig wird die Average-Statistik verwendet.

    Ändern der angezeigten Metriken: alle oder eine spezifische Metrik

    Wählen Sie aus der Liste Metrics (Metrik) eine Metrik aus. Standardmäßig werden alle Metriken angezeigt.

    Ändern, ob Knotenmetriken separat oder gemeinsam auf einem Graphen angezeigt werden

    Klicken Sie auf Nodes (Knoten). Standardmäßig werden die Knotendaten für eine Metrik auf einem kombinierten Graphen angezeigt. Wenn Sie die Knotendaten auf separaten Graphen anzeigen lassen, können Sie zusätzlich einzelne Knoten ein- oder ausblenden.

Diagramme der Clusterleistung

Im Folgenden finden Sie einige Beispiele für Diagramme, die in der neuen Amazon-Redshift-Konsole angezeigt werden.

  • CPU utilization (CPU-Auslastung) – zeigt den Prozentsatz der CPU-Auslastung für alle Knoten (Führungs- und Rechenknoten) an. Um einen Zeitpunkt zu ermitteln, zu dem die Clusterauslastung am niedrigsten ist, bevor die Clustermigration oder andere ressourcenaufwändige Vorgänge geplant wird, überwachen Sie dieses Diagramm, um die CPU-Auslastung pro einzelnem Knoten oder für alle Knoten anzuzeigen.

  • Maintenance mode (Wartungsmodus) – zeigt mithilfe der Indikatoren On und Off an, ob sich der Cluster zu einem bestimmten Zeitpunkt im Wartungsmodus befindet. Sie können den Zeitpunkt sehen, zu dem der Cluster gewartet wird. Sie können diese Zeit dann mit Operationen korrelieren, die mit dem Cluster durchgeführt werden, um seine zukünftigen Ausfallzeiten für wiederkehrende Ereignisse abzuschätzen.

  • Percentage disk space used (Prozentualer Speicherplatzverbrauch) – zeigt den Anteil des verwendeten Speicherplatzes pro Rechenknoten (nicht für den Cluster als Ganzes) an. Sie können dieses Diagramm untersuchen, um die Datenträgerauslastung zu überwachen. Wartungsvorgänge wie VACUUM und COPY verwenden temporären Zwischenspeicher für ihre Sortiervorgänge. Eine Spitze in der Datenträgernutzung ist daher zu erwarten.

  • Read throughput (Lesedurchsatz) – zeigt die durchschnittliche Zahl der Megabyte an, die pro Sekunde vom Datenträger gelesen werden. Sie können dieses Diagramm auswerten, um den entsprechenden physischen Aspekt des Clusters zu überwachen. Dieser Durchsatz beinhaltet nicht den Netzwerkdatenverkehr zwischen den Instances im Cluster und dessen Volume.

  • Read latency (Leselatenz) – zeigt die durchschnittliche Zeit an, die für I/O-Lesevorgänge vom Datenträger benötigt wird (in Millisekunden). Sie können die Reaktionszeiten für die zurückzugebenden Daten anzeigen. Wenn die Latenz hoch ist, bedeutet dies, dass der Absender mehr Zeit im Leerlauf verbringt (keine neuen Pakete sendet), was Geschwindigkeit des Durchsatzanstiegs verringert.

  • Write throughput (Schreibdurchsatz) – zeigt die durchschnittliche Zahl der Megabyte an, die pro Sekunde auf den Datenträger geschrieben werden. Sie können diese Metrik auswerten, um den entsprechenden physischen Aspekt des Clusters zu überwachen. Dieser Durchsatz beinhaltet nicht den Netzwerkdatenverkehr zwischen den Instances im Cluster und dessen Volume.

  • Write latency (Schreib-Latenz) – zeigt die durchschnittliche Zeit in Millisekunden an, die für I/O-Schreibvorgänge auf dem Datenträger benötigt wird. Sie können die Zeit für die Rückgabe der Schreibbestätigung auswerten. Wenn die Latenz hoch ist, bedeutet dies, dass der Absender mehr Zeit im Leerlauf verbringt (keine neuen Pakete sendet), was Geschwindigkeit des Durchsatzanstiegs verringert.

  • Database connections (Datenbankverbindungen) – zeigt die Anzahl der Datenbankverbindungen zu einem Cluster an. Sie können dieses Diagramm verwenden, um zu sehen, wie viele Verbindungen mit der Datenbank hergestellt werden, und um einen Zeitpunkt zu ermitteln, zu dem die Clusterauslastung am niedrigsten ist.

  • Total table count (Gesamtanzahl der Tabellen) – zeigt die Anzahl der Benutzertabellen an, die zu einem bestimmten Zeitpunkt innerhalb eines Clusters geöffnet sind. Sie können die Clusterleistung überwachen, wenn die Anzahl geöffneter Tabellen hoch ist.

  • Health status (Integritätsstatus) – zeigt den Zustand des Clusters als Healthy oder Unhealthy an. Wenn der Cluster eine Verbindung zu seiner Datenbank herstellen kann und eine einfache Abfrage erfolgreich ausführt, gilt der Cluster als fehlerfrei. Andernfalls ist der Cluster fehlerhaft. Ein fehlerhafter Status kann auftreten, wenn die Auslastung der Cluster-Datenbank sehr hoch ist, oder falls ein Konfigurationsproblem mit einer Datenbank auf dem Cluster vorliegt.

  • Query duration (Abfragedauer) – zeigt die durchschnittliche Zeit für das Abschließen einer Abfrage in Mikrosekunden an. Sie können die Daten in diesem Diagramm vergleichen, um die I/O-Leistung innerhalb des Clusters zu messen und bei Bedarf die zeitaufwendigsten Abfragen zu optimieren.

  • Query throughput (Abfragedurchsatz) – zeigt die durchschnittliche Anzahl abgeschlossener Abfragen pro Sekunde an. Sie können Daten in diesem Diagramm analysieren, um die Datenbankleistung zu messen und die Fähigkeit des Systems zu charakterisieren, ein Mehrbenutzer-Workload auf ausgewogene Weise zu unterstützen.

  • Query duration per WLM queue (Abfragedauer pro WLM-Warteschlange) – zeigt die durchschnittliche Zeit für das Abschließen einer Abfrage in Mikrosekunden an. Sie können die Daten in diesem Diagramm vergleichen, um die I/O-Leistung pro WLM-Warteschlange zu messen und bei Bedarf die zeitaufwendigsten Abfragen zu optimieren.

  • Query throughput per WLM queue (Abfragedurchsatz pro WLM-Warteschlange) – zeigt die durchschnittliche Anzahl abgeschlossener Abfragen pro Sekunde an. Sie können Daten in diesem Diagramm analysieren, um die Datenbankleistung pro WLM-Warteschlange zu messen.

  • Concurrency scaling activity (Nebenläufigkeitsskalierungsaktivität) – zeigt die Anzahl der aktiven Nebenläufigkeitsskalierungs-Cluster an. Bei aktivierter Nebenläufigkeitsskalierung fügt Amazon Redshift automatisch zusätzliche Cluster-Kapazität hinzu, wenn diese benötigt wird, um eine gestiegene Zahl von gleichzeitigen Leseabfragen zu verarbeiten.