PERF07-BP03 建立关键性能指标(KPI)来衡量工作负载性能 - AWS Well-Architected Framework

PERF07-BP03 建立关键性能指标(KPI)来衡量工作负载性能

确定定量和定性地衡量工作负载性能的 KPI。KPI 有助于衡量与业务目标相关的工作负载的运行状况。利用 KPI,业务和工程团队可在衡量目标和战略以及如何将二者结合来取得业务成果方面保持一致。当业务目标、战略或最终用户需求发生变化时,应重访 KPI。  

例如,网站工作负载可能会将页面加载时间用作总体性能指示。该指标是用来衡量最终用户体验的多个数据点之一。除了确定页面加载时间阈值之外,您还应记录未达到性能要求时的预期成果或业务风险。较长的页面加载时间会直接影响最终用户的体验,降低他们的用户体验评分,并可能导致客户流失。在定义 KPI 阈值时,请结合考虑行业基准和最终用户期望。例如,如果当前行业基准是两秒内加载网页,而您的最终用户希望网页在一秒内加载,那么您在建立 KPI 时应考虑这两个数据点。KPI 的另一个示例可能侧重于满足内部绩效需求。在生成生产数据后的一个工作日内,在生成销售报告时可以确立 KPI 阈值。这些报告可能会直接影响日常决策和业务成果。 

期望结果: 确立 KPI 涉及不同的部门和利益相关者。您的团队必须使用实时细粒度数据和历史数据作为参考来评估工作负载 KPI,并创建控制面板来对 KPI 数据执行指标计算,以获得运营和利用率见解。应记录 KPI,这可以说明议定的 KPI 和阈值,用于支持业务目标和战略,并且与所监控的指标对应起来。KPI 确定了绩效要求,所有团队应专门审查并经常分享和了解这些指标。清楚地确定风险和权衡机制,并了解未达到 KPI 阈值将产生的业务影响。

常见反模式:

  • 您仅监控系统级指标以获得工作负载见解,而不了解业务对这些指标产生的影响。

  • 您可以假设您的 KPI 已作为标准指标数据发布和共享。

  • 定义 KPI,但未与所有团队共享。

  • 未定义量化的、可衡量的 KPI。

  • 未使 KPI 与业务目标或战略保持一致。

建立此最佳实践的好处: 通过确定代表工作负载运行状况的具体指标,有助于使团队在其优先事项上保持一致和定义业务成果成功的标准。与所有部门共享这些指标可让所有人了解并一致认可阈值、期望值和业务影响。

未建立这种最佳实践的情况下暴露的风险等级:

实施指导

所有受工作负载运行状况影响的部门和业务团队应共同努力确立 KPI。由专人负责推动与组织 KPI 相关的协作、时间表、文档和信息。此单线负责人会经常分享业务目标和战略,并向业务利益相关者分配任务,以在各自的部门创建 KPI。在定义 KPI 后,运维团队通常会帮助定义指标,用于支持达成不同的 KPI 并通知成功情况。只有支持工作负载的所有团队成员都了解 KPI 时,KPI 才会有效。

实施步骤

  1. 确定并记录业务利益相关者。

  2. 确定公司目标和战略。

  3. 审查符合公司目标和战略的常见行业 KPI。

  4. 审查最终用户对您工作负载的期望。

  5. 定义和记录支持公司目标和战略的 KPI。

  6. 确定并记录为实现 KPI 而批准的权衡策略。

  7. 确定并记录可提供 KPI 信息的指标。

  8. 确定并记录严重性或警报级别的 KPI 阈值。

  9. 确定并记录未满足 KPI 时带来的风险和影响。

  10. 确定每个 KPI 的审查频率。

  11. 与所有支持工作负载的团队交流 KPI 文档内容。

实施指导的工作量级别: 定义和交流 KPI 所需的工作量为 。通常,可以在几周内与业务利益相关者会面,并审查目标、战略和工作负载指标来完成这项工作。

资源

相关文档:

相关视频:

相关示例: