PERF07-BP03 建立用於測量工作負載效能的關鍵績效指標 (KPI) - AWS Well-Architected 架構

PERF07-BP03 建立用於測量工作負載效能的關鍵績效指標 (KPI)

識別定量和定性衡量工作負載效能的 KPI。KPI 有助於測量工作負載的運作狀態,因為其與業務目標相關。KPI 允許業務和工程團隊在衡量目標和策略時,以及如何將其結合以產生業務成果方面保持一致。當業務目標、策略或最終使用者要求變更時,應該重新檢視 KPI。  

例如,網站工作負載可能使用頁面載入時間,做為整體效能的指示。此指標將是衡量最終使用者體驗的多個資料點之一。除了識別頁面載入時間閾值外,您還應該記錄未符合效能時預期的成果或業務風險。頁面載入時間若很長,將會直接影響您的最終使用者、降低其使用者體驗評分,並可能導致客戶流失。當您定義 KPI 閾值時,請同時結合業界基準和最終使用者期望。例如,如果目前業界基準是網頁在兩秒內載入,但您的最終使用者期望網頁在一秒內載入,則您在建立 KPI 時應將這兩個資料點列入考慮。另一個 KPI 範例可能專注於符合內部效能需求。可能根據在產生了生產資料後的一個工作日內產生銷售報告來建立 KPI 閾值。這些報告可能直接影響每日決策和業務成果。 

預期成果: 建立 KPI 涉及不同的部門和利害關係人。您的團隊必須使用即時精密資料和歷史資料來評估您的工作負載 KPI,以供參考,並建立儀表板,針對您的 KPI 資料執行指標數學,以衍生營運和使用率見解。KPI 應該加以記錄,說明已同意支援業務目標和策略的 KPI 和閾值,以及對應到受監控的指標。KPI 會識別效能要求,刻意進行審查,以及經常與所有團隊分享並使其理解。清楚地識別風險和取捨,並了解未符合 KPI 閾值時業務會受到何種影響。

常用的反模式:

  • 您只監控系統層級指標,以洞悉工作負載,但不了解對這些指標的業務影響。

  • 您假設 KPI 已發佈,並做為標準指標資料分享。

  • 定義 KPI 但未與所有團隊分享它們。

  • 未定義一個量化的可衡量 KPI。

  • 未使 KPI 與業務目標或策略保持一致。

建立此最佳實務的優勢: 識別代表工作負載運作狀態的特定指標有助於使團隊在其優先事項上保持一致,並定義成功的業務成果。與所有部門分享這些指標可對閾值、期望和業務影響提供可見性和一致性。

若未建立此最佳實務,暴露的風險等級:

實作指引

受工作負載運成狀態影響的所有部門和業務團隊都應為定義 KPI 做出貢獻。單一人員應該推動協同合作、時間軸、文件,以及與組織 KPI 相關的資訊。這個單一執行緒擁有者通常會分享業務目標和策略,並指派利害關係人任務,在其各自部門中建立 KPI。一旦定義了 KPI,營運團隊通常就會協助定義將支援和告知不同 KPI 成功的指標。僅當支援工作負載的所有團隊成員都意識到 KPI 時,KPI 才有效。

實作步驟

  1. 識別並記錄利害關係人。

  2. 識別公司目標和策略。

  3. 審查符合貴公司目標和策略的常見業界 KPI。

  4. 審查工作負載的最終使用者期望。

  5. 定義並記錄支援公司目標和策略的 KPI。

  6. 識別並記錄核准的取捨策略以符合 KPI。

  7. 識別並記錄將告知 KPI 的指標。

  8. 識別並記錄嚴重性或警示等級的 KPI 閾值。

  9. 識別並記錄未符合 KPI 時的風險和影響。

  10. 識別每個 KPI 的審查頻率。

  11. 與支援工作負載的所有團隊交流 KPI 文件。

實作指引的工作量: 定義和交流 KPI 是 工作量。這通常可以透過在幾週內與業務利害關係人會面、審查目標、策略和工作負載指標來完成。

資源

相關文件:

相關影片:

相關範例: