針對警示變更採取行動 - Amazon CloudWatch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

針對警示變更採取行動

CloudWatch 可以在兩種類型的警示變更時通知使用者:警示變更狀態時,以及更新警示組態時。

當警示評估時,它可能會從一個狀態變更為另一個狀態,例如 ALARM 或 OK。對於監控多個時間序列的 Metrics Insights 警示,每個時間序列 (貢獻者) 只能處於 ALARM 或 OK 狀態,絕不可以處於 INSUFFICIENT_DATA 狀態。這是因為時間序列只在資料存在時才存在。

警示動作和通知

下表顯示在警示層級與 Metrics Insights 警示的貢獻者層級執行的動作:

動作類型 警示層級 貢獻者層級 詳細資訊
SNS 通知 Amazon SNS 事件目的地
EC2 動作 (停止、終止、重新啟動、復原) 建立警示以停止、終止、重新啟動或復原 EC2 執行個體
Auto Scaling 動作 Amazon EC2 Auto Scaling 的步驟和簡單擴展政策
Systems Manager OpsItem 建立 設定 CloudWatch 警示以建立 OpsItems
Systems Manager Incident Manager 事件 使用 CloudWatch 警示自動建立事件
Lambda 函數叫用 從警示叫用 Lambda 函數
CloudWatch 調查調查 從警示啟動 CloudWatch 調查

警示通知的內容在單一指標警示和多時間序列警示之間有所不同:

  • 單一指標警示同時包含狀態原因和詳細的狀態原因資料,顯示導致狀態變更的特定資料點。

  • 多時間序列警示提供每個參與者的簡化狀態原因,無需詳細的狀態原因資料區塊。

範例 通知內容範例

單一指標警示通知包含詳細資訊:

{ "stateReason": "Threshold Crossed: 3 out of the last 3 datapoints [32.6 (03/07/25 08:29:00), 33.8 (03/07/25 08:24:00), 41.0 (03/07/25 08:19:00)] were greater than the threshold (31.0)...", "stateReasonData": { "version": "1.0", "queryDate": "2025-07-03T08:34:06.300+0000", "startDate": "2025-07-03T08:19:00.000+0000", "statistic": "Average", "period": 300, "recentDatapoints": [41, 33.8, 32.6], "threshold": 31, "evaluatedDatapoints": [ { "timestamp": "2025-07-03T08:29:00.000+0000", "sampleCount": 5, "value": 32.6 } // Additional datapoints... ] } }

多時間序列警示通知包含簡化原因:

{ "stateReason": "Threshold Crossed: 3 datapoints were greater than the threshold (0.0). The most recent datapoints which crossed the threshold: [32.6 (03/07/25 08:29:00)]." }

此外,每當警示變更狀態或建立、刪除或更新警示時,CloudWatch 就會傳送事件至 Amazon EventBridge。您可以撰寫 EventBridge 規則,以便在 EventBridge 接收這些事件時採取動作或收到通知。