Erstellen von verwalteten Grafana-Warnregeln - Amazon Managed Grafana

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen von verwalteten Grafana-Warnregeln

Dieses Dokumentationsthema wurde für Grafana-Workspaces entwickelt, die Grafana Version 9.x unterstützen.

Informationen zu Grafana-Workspaces, die Grafana Version 8.x unterstützen, finden Sie unter Arbeiten in Grafana Version 8.

Mit Grafana können Sie Warnregeln erstellen, die eine oder mehrere Datenquellen abfragen, die Ergebnisse reduzieren oder transformieren und sie miteinander oder mit festen Schwellenwerten vergleichen. Wenn diese ausgeführt werden, sendet Grafana Benachrichtigungen an den Kontaktpunkt.

So fügen Sie eine von Grafana verwaltete Regel hinzu
  1. Wählen Sie in Ihrer Grafana-Konsole im Grafana-Menü das Symbol Warnungen (Glocke), um die Seite Warnungen zu öffnen, auf der vorhandene Warnungen aufgeführt sind.

  2. Wählen Sie Neue Warnungsregel aus.

  3. Fügen Sie in Schritt 1 den Regelnamen, den Typ und den Speicherort wie folgt hinzu:

    • Fügen Sie unter Regelname einen beschreibenden Namen hinzu. Dieser Name wird in der Liste der Warnungsregeln angezeigt. Es ist auch die alertname Bezeichnung für jede Warnungs-Instance, die aus dieser Regel erstellt wird.

    • Wählen Sie in der Dropdownliste Regeltyp die Option Von Grafana verwaltete Warnung aus.

    • Wählen Sie in der Dropdownliste Ordner den Ordner aus, in dem Sie die Regel speichern möchten. Wenn Sie keinen Ordner auswählen, wird die Regel im General Ordner gespeichert. Um einen Ordner zu erstellen, wählen Sie das Dropdown-Menü aus und geben Sie einen neuen Ordnernamen ein.

  4. Fügen Sie in Schritt 2 die auszuwertenden Abfragen und Ausdrücke hinzu.

    • Behalten Sie den Standardnamen bei oder bewegen Sie den Mauszeiger über und wählen Sie das Bearbeitungssymbol, um den Namen zu ändern.

    • Wählen Sie für Abfragen eine Datenquelle aus der Dropdown-Liste aus.

    • Fügen Sie eine oder mehrere Abfragen oder Ausdrücke hinzu.

    • Wählen Sie für jeden Ausdruck entweder Classic-Bedingung aus, um eine einzelne Warnungsregel zu erstellen, oder wählen Sie aus den Optionen Mathematische , Reduzieren, Stichprobe neu abfragen, um separate Warnungen für jede Serie zu generieren. Einzelheiten zu diesen Optionen finden Sie unter Ein- und mehrdimensionale Regeln.

    • Wählen Sie Abfragen ausführen aus, um zu überprüfen, ob die Abfrage erfolgreich ist.

  5. Fügen Sie in Schritt 3 Bedingungen hinzu.

    • Wählen Sie in der Dropdownliste Bedingung die Abfrage oder den Ausdruck aus, um die Warnungsregel zu initiieren.

    • Geben Sie für Jede bewerten die Häufigkeit der Auswertung an. Muss ein Vielfaches von 10 Sekunden sein. Zum Beispiel 1m, 30s.

    • Geben Sie unter Auswerten für die Dauer an, für die die Bedingung wahr sein muss, bevor eine Warnung ausgelöst wird.

      Anmerkung

      Nachdem eine Bedingung überschritten wurde, geht die Warnung in den Pending Status über. Wenn die Bedingung für die angegebene Dauer verletzt bleibt, wechselt die Warnung in den Firing Status . Wenn er nicht mehr erfüllt ist, wird er wieder in den -NormalStatus zurückgesetzt.

    • Konfigurieren Sie unter Keine Daten konfigurieren und Fehlerbehandlung das Warnverhalten bei fehlender Daten. verwenden Sie die Richtlinien unter Umgang ohne Daten oder Fehlerfälle.

    • Wählen Sie Vorschauwarnungen, um das Ergebnis der Ausführung der Abfrage zu diesem Zeitpunkt zu überprüfen. Die Vorschau schließt keine Daten und Bedingungen für die Fehlerbehandlung aus.

  6. Fügen Sie in Schritt 4 zusätzliche Metadaten hinzu, die der Regel zugeordnet sind.

    • Fügen Sie eine Beschreibung und Zusammenfassung hinzu, um Warnmeldungen anzupassen. Befolgen Sie die Richtlinien in Beschriftungen und Anmerkungen.

    • Fügen Sie Runbook-URL, Panel, Dashboard und Warnungs-IDs hinzu.

    • Fügen Sie benutzerdefinierte Labels hinzu.

  7. Wählen Sie Speichern, um die Regel zu speichern, oder Speichern und Beenden, um die Regel zu speichern und zur Seite Warnungen zurückzukehren.

Nachdem Sie Ihre Regel erstellt haben, können Sie eine Benachrichtigung für Ihre Regel erstellen. Weitere Informationen zu Benachrichtigungen finden Sie unter Verwalten Ihrer Warnmeldungen.

Ein- und mehrdimensionale Regeln

Für von Grafana verwaltete Warnungsregeln können Sie eine Regel mit einer klassischen Bedingung erstellen oder eine mehrdimensionale Regel erstellen.

Eindimensionale Regel (klassische Bedingung)

Verwenden Sie einen klassischen Bedingungsausdruck, um eine Regel zu erstellen, die eine einzelne Warnung auslöst, wenn die Bedingung erfüllt ist. Bei einer Abfrage, die mehrere Serien zurückgibt, verfolgt Grafana nicht den Warnstatus jeder Serie. Daher sendet Grafana nur eine einzige Warnung, auch wenn die Alert-Bedingungen für mehrere Serien erfüllt sind.

Weitere Informationen zum Formatieren von Ausdrücken finden Sie unter Ausdrücke in der Grafana-Dokumentation.

Mehrdimensionale Regel

Um für jede in der Abfrage zurückgegebene Serie eine separate Warninstanz zu generieren, erstellen Sie eine mehrdimensionale Regel.

Anmerkung

Jede durch eine mehrdimensionale Regel generierte Warnungs-Instance wird auf Ihr Gesamtkontingent an Warnungen angerechnet. Regeln werden nicht ausgewertet, wenn Sie Ihr Kontingent an Warnungen erreichen. Weitere Informationen zu Kontingenten für mehrdimensionale Regeln finden Sie unter Fehler beim Erreichen des Kontingents.

Um mehrere Instances aus einer einzigen Regel zu erstellen, verwenden Sie Reduce-, - oder -ResampleAusdrückeMath, um eine mehrdimensionale Regel zu erstellen. Beispielsweise ist Folgendes möglich:

  • Fügen Sie für jede Abfrage einen Reduce Ausdruck hinzu, um Werte im ausgewählten Zeitraum zu einem einzigen Wert zu aggregieren. (Nicht erforderlich für Regeln, die numerische Daten verwenden).

  • Fügen Sie einen Math Ausdruck mit der Bedingung für die Regel hinzu. Dies ist nicht erforderlich, wenn eine Abfrage oder ein Reduzierungsausdruck bereits 0 zurückgibt, wenn die Regel keine Warnung auslösen soll, oder eine positive Zahl, wenn sie eine Warnung auslösen soll.

    Hier einige Beispiele:

    • $B > 70 , wenn eine Warnung ausgelöst werden soll, falls der Wert für die Abfrage/den Ausdruck B mehr als 70 beträgt.

    • $B < $C * 100 für den Fall, dass eine Warnung ausgelöst werden soll, wenn der Wert von B kleiner als der Wert von C multipliziert mit 100 ist. Wenn verglichene Abfragen mehrere Serien in ihren Ergebnissen haben, werden Serien aus verschiedenen Abfragen abgeglichen, wenn sie dieselben Bezeichnungen haben oder eine Teilmenge der anderen ist.

Anmerkung

Grafana unterstützt keine Alert-Abfragen mit Vorlagenvariablen. Weitere Informationen finden Sie auf der Community-Seite Vorlagenvariablen werden bei Alert-Abfragen beim Einrichten von Alert nicht unterstützt.

Leistungsüberlegungen für mehrdimensionale Regeln

Jede Alert-Instance wird auf das Alert-Kontingent angerechnet. Mehrdimensionale Regeln, die mehr Instances erstellen, als innerhalb des Warnungskontingents berücksichtigt werden können, werden nicht ausgewertet und geben einen Kontingentfehler zurück. Weitere Informationen finden Sie unter Fehler beim Erreichen des Kontingents.

Mehrdimensionale Warnmeldungen können sich stark auf die Leistung Ihres Grafana-Workspace auswirken sowie auf die Leistung Ihrer Datenquellen, während Grafana sie abfragt, um Ihre Warnungsregeln zu bewerten. Die folgenden Überlegungen können hilfreich sein, wenn Sie versuchen, die Leistung Ihres Überwachungssystems zu optimieren.

  • Häufigkeit der Regelauswertung – Die Eigenschaft Alle bewerten einer Warnungsregel steuert die Häufigkeit der Regelauswertung. Wir empfehlen, die niedrigste akzeptable Auswertungshäufigkeit zu verwenden.

  • Kardinalität der Ergebnismenge – Die Anzahl der Warn-Instances, die Sie mit einer Regel erstellen, wirkt sich auf ihre Leistung aus. Angenommen, Sie überwachen API-Antwortfehler für jeden API-Pfad auf jeder VM in Ihrer Flotte. Dieser Satz hat eine Kardinalität der Anzahl der Pfade multipliziert mit der Anzahl der VMs . Sie können die Kardinalität der Ergebnismenge reduzieren, indem Sie beispielsweise die Gesamtzahl der Fehler pro VM anstelle des Pfads pro VM überwachen.

  • Komplexität der Abfrage – Abfragen, die Datenquellen verarbeiten und darauf reagieren können, verbrauchen schnell weniger Ressourcen. Obwohl diese Überlegung weniger wichtig ist als die anderen oben aufgeführten Überlegungen, könnte die Betrachtung der Leistung einzelner Abfragen einen Unterschied bewirken, wenn Sie diese so weit wie möglich reduziert haben. Sie sollten sich auch der Auswirkungen der Auswertung dieser Regeln auf die Leistung Ihrer Datenquellen bewusst sein. Warnungsabfragen sind oft die meisten Abfragen, die von der Überwachung von Datenbanken verarbeitet werden, sodass sich dieselben Lastfaktoren, die sich auf die Grafana-Instance auswirken, auch auf sie auswirken.

Fehler beim Erreichen des Kontingents

Es gibt ein Kontingent für die Anzahl der Alert-Instances, die Sie in einem einzelnen Workspace haben können. Wenn Sie diese Zahl erreichen, können Sie in diesem Workspace keine neuen Warnregeln mehr erstellen. Bei mehrdimensionalen Warnungen kann die Anzahl der Warninstanzen im Laufe der Zeit variieren.

Beachten Sie Folgendes, wenn Sie mit Alert-Instances arbeiten.

  • Wenn Sie nur eindimensionale Regeln erstellen, ist jede Regel eine einzelne Warninstanz. Sie können dieselbe Anzahl von Regeln in einem einzigen Workspace wie Ihr Alert-Instance-Kontingent erstellen und nicht mehr.

  • Mehrdimensionale Regeln erstellen mehrere Warninstanzen, die Zahl ist jedoch erst bekannt, wenn sie ausgewertet werden. Wenn Sie beispielsweise eine Warnungsregel erstellen, die die CPU-Auslastung Ihrer Amazon EC2-Instances verfolgt, gibt es möglicherweise 50 EC2-Instances, wenn Sie sie erstellen (und damit 50 Alert-Instances). Wenn Sie jedoch jede Woche 10 weitere EC2-Instances hinzufügen, hat die nächste Auswertung 60 Alert-Instances.

    Die Anzahl der Alert-Instances wird ausgewertet, wenn Sie eine mehrdimensionale Warnung erstellen, und Sie können keine erstellen, die Sie sofort über Ihr Alert-Instance-Kontingent setzt. Da sich die Anzahl der Alert-Instances ändern kann, wird Ihr Kontingent jedes Mal überprüft, wenn Ihre Regeln ausgewertet werden.

  • Wenn eine Regel Sie zum Zeitpunkt der Regelauswertung veranlasst, Ihr Kontingent für Alert-Instances zu überschreiten, wird diese Regel erst ausgewertet, wenn eine Aktualisierung der Alert-Regel vorgenommen wurde, die die Gesamtzahl der Alert-Instances unter das Servicekontingent bringt. In diesem Fall erhalten Sie eine Warnmeldung, in der Sie darüber informiert werden, dass Ihr Kontingent erreicht wurde (die Benachrichtigung verwendet die Benachrichtigungsrichtlinie für die ausgewertete Regel). Die Benachrichtigung enthält eine ErrorAnmerkung mit dem Wert QuotaReachedError.

  • Eine Regel, die dazu führt, dass ein QuotaReachedError nicht mehr ausgewertet wird. Die Auswertung wird nur fortgesetzt, wenn ein Update durchgeführt wird und die Auswertung nach dem Update selbst nicht zu einem führtQuotaReachedError. Eine Regel, die nicht ausgewertet wird, zeigt den Fehler Kontingent erreicht in der Grafana-Konsole an.

  • Sie können die Anzahl der Alert-Instances verringern, indem Sie Alert-Regeln entfernen oder mehrdimensionale Alerts bearbeiten, um weniger Alert-Instances zu haben (z. B. indem Sie eine Warnung bei Fehlern pro VM und nicht eine Warnung bei Fehlern pro API in einer VM haben).

  • Um Bewertungen fortzusetzen, aktualisieren Sie die Warnung und speichern Sie sie. Sie können sie aktualisieren, um die Anzahl der Alert-Instances zu verringern, oder wenn Sie andere Änderungen vorgenommen haben, um die Anzahl der Alert-Instances zu verringern, können Sie sie ohne Änderungen speichern. Wenn es fortgesetzt werden kann, ist es das. Wenn es einen anderen verursachtQuotaReachedError, können Sie ihn nicht speichern.

  • Wenn eine Warnung gespeichert wird und die Auswertung wieder aufnimmt, ohne das Warnungskontingent zu überschreiten, kann der Fehler Kontingent erreicht für einige Zeit (bis zu seinem Auswertungsintervall) in der Grafana-Konsole angezeigt werden. Die Auswertung der Warnungsregel wird jedoch gestartet und Warnungen werden gesendet, wenn der Regelschwellenwert erreicht wird.

  • Weitere Informationen zum Alarmkontingent sowie zu anderen Kontingenten finden Sie unter Service Quotas für Amazon Managed Grafana.

Umgang ohne Daten oder Fehlerfälle

Wählen Sie Optionen für den Umgang mit dem Warnungsverhalten, wenn keine Daten vorhanden sind oder wenn Fehler auftreten.

Die Optionen für den Umgang mit keinen Daten sind in der folgenden Tabelle aufgeführt.

Keine Datenoption Behavior

Keine Daten

Erstellen Sie eine Warnung DatasourceNoData mit dem Namen und der UID der Warnungsregel sowie der UID der Datenquelle, die keine Daten als Labels zurückgegeben hat.

Warnfunktion

Setzen Sie den Status der Warnungsregel auf Alerting.

OK

Setzen Sie den Status der Warnungsregel auf Normal.

Die Optionen für die Behandlung von Fehlerfällen sind in der folgenden Tabelle aufgeführt.

Fehler- oder Timeout-Option Behavior

Warnfunktion

Setzen Sie den Status der Warnungsregel auf Alerting

OK

Setzen Sie den Status der Warnungsregel auf Normal

Fehler

Erstellen Sie eine Warnung DatasourceError mit dem Namen und der UID der Warnungsregel sowie der UID der Datenquelle, die keine Daten als Labels zurückgegeben hat.