概觀 - Amazon Managed Grafana

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

概觀

本文件主題是針對支援 Grafana 10.x 版的 Grafana 工作區所設計。

如需支援 Grafana 9.x 版的 Grafana 工作區,請參閱。在 Grafana 第 9 版中工作

如需支援 Grafana 8.x 版的 Grafana 工作區,請參閱。在 Grafana 第 8 版中工作

無論您是剛起步還是經驗較豐富的 Grafana Alerting 使用者,都可以深入瞭解可協助您建立、管理和回應警示的基礎知識和可用功能,並提升團隊快速解決問題的能力。

原理

在基於 PromeTheus 的警報系統中,您有一個警報生成器,可以創建警報和接收警報的警報接收器。例如,Prometheus 是一個警報生成器,負責評估警報規則,而 Alertmanager 是警報接收器,負責分組,禁止,靜音和發送有關觸發和已解決警報的通知。

Grafana 警報是建立在設計警報系統的 Prometheus 模型上。它有一個內部警報生成器,負責調度和評估警報規則,以及負責分組,禁止,靜音和發送通知的內部警報接收器。Grafana 不使用 Prometheus 作為它的警報生成器,因為 Grafana 警報需要除了 Prometheus 與許多其他數據源的工作。但是,它確實使用警報管理器作為其警報接收器。

警報會傳送至警示接收者,在這些接收者處於路由、分組、抑制、靜音和通知的位置。在 Grafana 警報中,默認的警報接收器是嵌入 Grafana 內部的警報管理器,被稱為 Grafana 警報管理器。但是,您也可以使用其他警報管理器,這些被稱為外部警報管理器。

基本面

以下提供 Grafana 警示不同部分的概觀。

警示規則

警示規則是決定何時觸發警示的一組準則。它包含一或多個查詢和運算式、需要符合的條件、決定警示規則評估頻率的間隔,以及必須符合條件才能觸發警示的持續時間。

警示規則會根據其間隔進行評估,且每個警示規則一次可以觸發零、一個或任意數目的警示。警示規則的狀態是由其最多的警示所決定,severe警示規則可以是「正常」、「擱置中」或「觸發」的其中一個。例如,如果至少有一個警示規則的警示正在觸發,則警示規則也會觸發。警示規則的健全狀況取決於其最近評估的狀態。這些可以是正常的,錯誤和 NoData。

警報規則的一個非常重要的功能是它們支持自定義註釋和標籤。這些功能可讓您使用其他中繼資料 (例如摘要和說明) 來檢測警示,並新增其他標籤,將警示路由傳送至特定通知原則。

Alerts (提醒)

警報是由一組稱為標籤的鍵/值對唯一標識。每個鍵都是一個標籤名稱,每個值都是一個標籤值。例如,一個警示可能有標籤,foo=bar而另一則警示可能包含標籤foo=baz。警報可以有許多標籤,例如,foo=bar,bar=baz但不能兩次具有相同的標籤,例如foo=bar,foo=baz。兩個警示也不能有相同的標籤,而且如果兩個警示具有相同的標籤 (例如foo=bar,bar=baz),foo=bar,bar=baz則會捨棄其中一個警示。當警示規則中的條件不再符合或刪除警示規則時,就會解決警示。

在 Grafana 管理警示中,警示可以處於「正常」、「擱置中」、「警示」、「無資料」或「錯誤」狀態。在資料來源受管理的警示 (例如 Mimir 和 Loki) 中,警示可以處於「正常」、「待處理」和「警示」狀態,但不 NoData 可處於「錯誤」狀態。

聯絡點

聯絡方式會決定傳送通知的位置。例如,您可能有一個聯絡人,可以將通知傳送至電子郵件地址、Slack、事件管理系統 (IRM) (例如 Grafana OnCall 或 Pageduty),或傳送至網路掛接。

您可以使用通知範本自訂從聯絡點傳送的通知。您可以使用通知範本來變更通知的標題、訊息和結構。通知範本並不專屬於個別整合或聯絡點。

通知政策

通知原則會將警示分組,然後將它們路由至聯絡點。它們會決定傳送通知的時間,以及應重複通知的頻率。

使用標籤匹配器將警示與通知原則進行比對。這些是人類可讀的表達式,斷言是否警報的標籤完全匹配,不完全匹配,包含或不包含某些預期的文本。例如,foo=bar匹配器匹配警報與標籤,foo=bar而匹foo=~[a-zA-Z]+配器匹配警報與任何稱為 foo 的標籤與正則表達式匹配的值。[a-zA-Z]+

根據預設,警示只能符合一個通知原則。但是,使用continue功能警報可以同時發出匹配任意數量的通知策略。如需通知原則的詳細資訊,請參閱通知原則

靜音和靜音時序

靜音和靜音計時可讓您暫停特定警示或甚至整個通知政策的通知。使用靜音來暫停臨時通知,例如在維護時段期間;並使用靜音計時來定期暫停通知,例如晚上和週末。