本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
本文件主題討論 Grafana 中的舊版提醒。Amazon Managed Grafana 的未來版本不支援此項目。您可以遷移至 Grafana 提醒,以使用最新的提醒功能。如需詳細資訊,請參閱下列其中一個主題。
如需支援 Grafana 10.x 版的 Grafana 工作區,請參閱Grafana 第 10 版中的提醒。
如需支援 Grafana 9.x 版的 Grafana 工作區,請參閱Grafana 第 9 版中的提醒。
如需支援 Grafana 8.x 版的 Grafana 工作區,請參閱Grafana 提醒。
當您使用 Amazon Managed Grafana 警示時,您可以將規則連接至儀表板面板。當您儲存儀表板時,Amazon Managed Grafana 會將警示規則擷取到單獨的警示規則儲存體中,並排定評估時間。
在圖形面板的警示索引標籤上,您可以設定應評估警示規則的頻率,以及警示變更狀態並啟動其通知時必須符合的條件。
目前,只有圖形面板支援提醒規則。
新增或編輯提醒規則
-
導覽至新增或編輯提醒規則的面板,選擇標題,然後選擇編輯。
-
在提醒索引標籤上,選擇建立提醒。如果此面板已有提醒,您可以編輯提醒索引標籤上的欄位。
-
填寫欄位。如需詳細資訊,請參閱警示規則欄位。
-
當您完成撰寫規則時,請選擇右上角的儲存,以儲存提醒規則和儀表板。
-
(選用但建議) 若要確保規則傳回您預期的結果,請選擇測試規則。
刪除提醒規則
若要刪除提醒,請捲動至提醒底部,然後選擇刪除。
警示規則欄位
本節說明您為建立提醒而填寫的欄位。
規則
-
名稱 – 輸入描述性名稱。名稱會顯示在提醒規則清單中。
-
評估每個 - 指定排程器評估提醒規則的頻率。這稱為評估間隔。
-
對於 - 指定在觸發提醒通知之前,查詢必須違反設定的閾值的時間長度。
警告
請勿使用 ,For
並將 If no data or all values are null
設定設為 No Data
。的觸發No Data
會立即觸發,不會For
考慮。如果警示從 轉換,這也可能導致無法傳送 OK 通知No Data -> Pending -> OK
。
如果警示規則已設定 ,For
且查詢違反設定的閾值,則會先從 OK
移至 Pending
。從 OK
前往 Pending
,Amazon Managed Grafana 不會傳送任何通知。當警示規則射擊超過For
持續時間時,它會變更為 Alerting
並傳送警示通知。
一般而言,我們建議您使用此設定,因為在提醒通知啟動之前,誤報通常比等待幾分鐘更差。查看 Alert list
或 Alert list panels
,您將能夠看到處於待定狀態的提醒。
條件
目前,唯一的現有條件類型是可讓您指定查詢字母、時間範圍和彙總函數Query
的條件。
查詢條件範例
avg() OF query(A, 15m, now) IS BELOW 14
-
avg()
控制如何將每個序列的值減少為可與閾值比較的值。選擇 函數,將其變更為另一個彙總函數。 -
query(A, 15m, now)
該字母定義要從指標索引標籤執行的查詢。第二個兩個參數定義時間範圍:15m, now
表示 15 分鐘前到現在。您也可以使用10m, now-2m
來定義 10 分鐘前到 2 分鐘前的時間範圍。如果您想要忽略最後 2 分鐘的資料,這會很有用。 -
IS BELOW 14
定義閾值的類型和閾值。您可以選擇IS BELOW
變更閾值類型。
警示規則中使用的查詢不能包含任何範本變數。目前,我們僅支援 AND
和 條件之間的OR
運算子,而且它們是連續執行的。例如,我們有三種條件,順序如下:healthment:A(評估為:TRUE) OR condition:B(評估為:FALSE) AND condition:C(評估為:TRUE),因此結果計算為 ((TRUE 或 FALSE) AND TRUE) = TRUE。
多個系列
如果查詢傳回多個序列,則會針對每個序列評估彙總函數和閾值檢查。目前,Amazon Managed Grafana 不會追蹤每個系列的警示規則狀態。以下案例會詳細說明其含意。
-
具有查詢的警示條件,會傳回兩個序列:server1 和 server2。
-
Server1 系列會導致警示規則觸發並切換到狀態
Alerting
。 -
通知會與訊息一起傳送:負載峰值 (server1)
-
在對相同警示規則的後續評估中,server2 系列也會觸發警示規則。
-
不會傳送新的通知,因為提醒規則已處於 狀態
Alerting
。
如上一個案例所示,如果規則已處於 狀態Alerting
,Grafana 不會在其他系列導致警示觸發時傳送通知。
注意
您可以設定針對觸發的提醒傳送提醒。這會在警示持續觸發時傳送其他通知。如果其他系列 (例如上一個範例中的 server2) 也導致警示規則觸發,則這些規則會包含在提醒通知中。視您使用的通知管道而定,您可能可以利用此功能來識別導致警示觸發的新或現有系列。
無資料和錯誤處理
下表包含控制規則評估引擎如何處理未傳回資料或僅傳回 null 值的查詢的條件。
無資料選項 | 描述 |
---|---|
無資料 | 將警示規則狀態設定為 NoData 。 |
提醒 | 將警示規則狀態設定為 Alerting 。 |
保留最後狀態 | 保持目前的警示規則狀態,無論其為何。 |
好的 | 支援,但通常沒有用。 |
執行錯誤或逾時
下列選項會告知 Amazon Managed Grafana 如何處理執行或逾時錯誤。
錯誤或逾時選項 | 描述 |
---|---|
提醒 | 將警示規則狀態設定為 Alerting 。 |
保留最後狀態 | 保持目前的警示規則狀態,無論其為何。 |
如果您有不可靠的時間序列存放區,查詢有時會逾時或隨機失敗,您可以將此選項設定為 Keep Last State
,基本上忽略它們。
通知
在警示索引標籤上,您也可以指定警示規則通知,以及有關警示規則的詳細訊息。訊息可以包含任何內容:有關如何解決問題的資訊、 Runbook 的連結等。
實際通知是在多個提醒之間設定和共用。如需如何設定通知的資訊,請參閱提醒通知。
-
傳送到 – 如果您有設定提醒通知管道,請選取提醒通知管道。
-
訊息 – 輸入要在通知管道傳送的文字訊息。有些提醒通知程式支援將文字轉換為 HTML 或其他豐富格式。
-
標籤 – 指定要包含在通知中的標籤清單 (索引鍵值)。只有某些標記符支援此功能。
警示狀態歷史記錄和註釋
警示狀態變更會記錄在 Amazon Managed Grafana 資料庫的內部註釋資料表中。狀態變更會在警示規則的圖形面板中以註釋形式視覺化。您也可以前往警示索引標籤的State history
子選單,以檢視和清除狀態歷史記錄。