使用警報管理器在適用於 Prometheus 的 Amazon 託管服務中管理和轉發警報 - Amazon Managed Service for Prometheus

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用警報管理器在適用於 Prometheus 的 Amazon 託管服務中管理和轉發警報

若正在啟動 Amazon Managed Service for Prometheus 執行的警示規則,警示管理員處理已傳送的警示。這會刪除重複項目、分組,並將警示路由至下游接收者。Amazon Managed Service for Prometheus 僅支援 Amazon Simple Notification Service 作為接收者,且可將訊息傳送至相同帳戶中的 Amazon SNS 主題。您也可使用警示管理員將警示靜音和禁止。

警示管理員會在 Prometheus 中提供 Alertmanager 的相似功能。

您可以針對下列項目使用警示管理員的組態檔案:

  • 分組:分組會將類似的警示收集到單一通知中。若許多系統立即無法執行且可能同步射擊數以百計的警示,則這會特別實用。例如,假設網路故障會導致許多節點同時無法執行。若已將這些警示類型分組,警示管理員會傳送單一通知給您。

    警示分組和分組通知的時間是由警示管理員組態檔案中的路由樹狀結構來設定。如需詳細資訊,請參閱<常式>

  • 抑制:若已發射某些其他警報,則會抑制某些警示的通知。例如,若發出的警示與無法觸及的叢集相關,則可組態警示管理員將此叢集所有其他警示靜音。這樣可以防止發生與實際問題無關的數百或數千個觸發警報的通知。如需如何撰寫抑制規則的詳細資訊,請參閱<inhibit_rule>

  • 靜音:靜音將警示靜音一段時間,例如在維護時段期間。將會檢查收到的警示與啟用中靜音的所有相等或一般表達式匹配程式相符。若要執行此作業,將不會傳送該警示的通知。

    若要建立靜音,請使用 PutAlertManagerSilences API。如需詳細資訊,請參閱 PutAlertManagerSilences

Prometheus 範本

獨立 Prometheus 支持模板,使用單獨的模板文件。範本可在其他事物之間使用條件和格式資料。

在 Prometheus 的 Amazon 受管服務中,您可以將範本放在與警示管理員組態相同的警示管理員組態檔案中。