使用 OpsCenter 中的 Incident Manager
此主題描述了如何建立來自現有 OpsItem 的 AWS Incident Manager 事件。事件是指任何意外中斷或服務質量下降。Incident Manager 是 AWS Systems Manager 的一項功能,可提供事件管理主控台,協助您緩解影響 AWS 託管應用程式的事件並從中復原。
Incident Manager 可通知回應人員 AWS 資源如何受到影響、反白相關的故障診斷資料,並提供協同合作工具來備份和執行服務,藉此增強事件解決方案。為了達到降低重大事件解決時間的主要目標,Incident Manager 會將回應計劃自動化,並允許回應人員團隊上報。如需詳細資訊,請參閱《AWS Systems Manager Incident Manager 使用者指南》。
事件解決後,發佈事件分析會引導您找出事件回應的改進措施,並建議處理問題清單的動作項目。對於高嚴重性的作業問題,例如事件,建立 OpsCenter 中的 OpsItem 為操作人員提供事件的完整檢視,包括分析和動作項目。OpsCenter 是 Systems Manager 的功能。此全面檢視可提升解決效率,並協助在未來減少類似的問題。
運作方式
設定 Incident Manager 之後,系統會採用下列方式與 OpsCenter 整合:
-
在 Incident Manager 中建立事件之後,系統會在 OpsCenter 中建立 OpsItem (如果 OpsItem 不存在)。事件會新增為 OpsItem 的相關項目。這是稱為父系 OpsItem 的第一個 OpsItem。您也可以手動建立來自 OpsItem 的事件。建立來自 OpsItem 的事件後,OpsItem 已升級為父系 OpsItem。
除了為標準 OpsItems 顯示的 Overview (概觀) 和 Related resource details (相關資源詳細資訊) 索引標籤外,包含事件的 OpsItems 有兩個額外的索引標籤。包含事件的 OpsItems 會在 Associated items (關聯的項目) 索引標籤上顯示相關事件、OpsItems、分析和動作項目。Timeline (時間表) 索引標籤會依時間順序顯示相關事件的歷史記錄,以及父系 OpsItem 的分析。
-
如果事件的規模和範圍成長,則您可以在其中新增其他事件。
-
事件關閉後,您可以從 Incident Manager 中的事件建立分析。分析可以協助您定義改進程序,以在未來減少類似的問題。系統會自動使用分析更新 OpsCenter 中的事件。如果分析包含動作項目,則系統會在分析下建立額外的 OpsItems。這些額外 OpsItems 為 Action Item (動作項目) 類型。
開始之前
您必須在 Incident Manager 中設定回應計劃。回應計劃定義如何將事件上報給第一個回應人員,以及這些回應人員應採取哪些動作。如需詳細資訊,請參閱回應計劃。
建立 OpsItem 事件
使用下列處理程序手動建立 OpsItem 事件。
手動建立 OpsItem 事件
開啟位於 AWS Systems Managerhttps://console.aws.amazon.com/systems-manager/ 的 主控台。https://console.aws.amazon.com/systems-manager/
-
在導覽窗格中,選擇 OpsCenter。
-
如果 Incident Manager 為您建立 OpsItem,請選擇它並前往步驟 5。如果沒有,請選擇 Create OpsItem (建立 OpsItem) 並填寫表格。如果您沒有看到此按鈕,請選擇 OpsItems 索引標籤,然後選擇 Create OpsItem (建立 OpsItem)。
-
如果建立了新的 OpsItem,則請開啟。
-
選擇 Start Incident (開始事件)。
-
對於 Response plan (回應計劃) 中,選擇您要指派給此事件的 Incident Manager 回應計劃。
-
(選用) 對於 Title (標題) 中,輸入描述名稱,以協助其他團隊成員了解事件的本質。如果不輸入新的標題,OpsCenter 會使用回應計劃中的標題建立 OpsItem 和 Incident Manager 中的對應事件。
-
(選用)對於 Incident impact (事件影響),選擇此事件的影響層級。如果您沒有選擇影響層級,OpsCenter 會使用回應計劃中的標題建立 OpsItem 和 Incident Manager 中的對應事件。
-
選擇 Start (啟動)。