OPS10-BP02 每個提醒建立一個程序 - AWS Well-Architected 架構

OPS10-BP02 每個提醒建立一個程序

對於引發提醒的任何事件,建立明確定義的回應 (執行手冊或程序手冊),並指明。此舉可確保對營運事件的有效而迅速的回應,並防止需採取動作的事件被無價值的通知所淹沒。

常用的反模式:

  • 您的監控系統會將核准的連線串流以及其他訊息一起提供給您。訊息數量如此龐大,以至於您錯過需要您介入的定期錯誤訊息。

  • 您收到提醒,指出網站運作中斷。發生這種情況時沒有已定義的程序。您必須採取臨機操作方法來診斷和解決問題。隨需開發此程序會延長復原時間。

建立此最佳實務的優勢: 只有在需要採取動作時才發出提醒,可防止低值提醒隱藏高值提醒。透過讓每個可採取動作的提醒都具有一個程序,您可針對環境中的事件實現一致且迅速的回應。

若未建立此最佳實務,暴露的風險等級為:

實作指引

  • 每個提醒建立一個程序:對於引發提醒的任何事件,都應建立明確定義的回應 (執行手冊或程序手冊),並指明負責人 (例如,個人、團隊或角色) 來對成功完成的程序負責。回應的執行可以自動化,也可以由另一個團隊完成,但負責人要對確保流程交付預期結果負責。透過建立這些程序,您可以確保對營運事件做出迅速有效的回應,並防止需採取行動的事件被無價值的通知所淹沒。例如,自動調整規模功能可能應用於調整 Web 前端規模,但營運團隊可能需負責確保自動調整規模規則和限制符合工作負載需求。

資源

相關文件:

相關影片: