PERF05-BP07 定期檢閱指標 - AWS Well-Architected 架構

PERF05-BP07 定期檢閱指標

作為日常維護或對事件或事故的回應,檢閱所收集的指標。透過這些審查來識別哪些指標是解決問題的關鍵,以及哪些其他指標 (如果被追蹤) 將有助找出、解決或預防問題。

常見的反模式:

  • 您讓指標長時間持續處於警示狀態。

  • 您建立自動化系統無法採取行動的警示。

建立此最佳實務的優勢: 持續審查正在收集的指標,以確認指標正確識別、處理或防止問題發生。如果讓指標長時間持續處於警示狀態,指標也會變得過時。

未建立此最佳實務時的曝險等級:

實作指引

不斷改進指標收集和監控。作為對事故或事件的回應的一部分,評估哪些指標有助於解決問題,哪些指標可以幫助解決問題但未被追蹤。使用此方法提高所收集指標的品質,從而防止事故發生或更快地解決將來的事故。

作為對事故或事件的回應的一部分,評估哪些指標有助於解決問題,哪些指標可以幫助解決問題但未被追蹤。使用此方法提高所收集指標的品質,進而防止事故發生或更快地解決將來的事故。

實作步驟

  1. 定義與您的工作負載目標一致的關鍵效能指標以利進行監控。

  2. 設定各個測量的基準和期待值。

  3. 設定規律 (例如每週或每月一次) 以檢閱重要指標。

  4. 每次審查期間都會評估趨勢,以及與基準值的偏差。查看是否有任何效能瓶頸或異常情況。

  5. 對於已確認的問題,請展開深入根本原因分析,以了解問題背後的主要原因。

  6. 記錄您的調查結果,並使用策略來處理已確認的問題和瓶頸。

  7. 持續評估並改善指標檢閱過程。

資源

相關文件:

相關影片:

相關範例: