OPS04-BP01 识别关键绩效指标 - AWS Well-Architected Framework

OPS04-BP01 识别关键绩效指标

要在工作负载中实现可观测性,首先要了解其状态并根据业务需求做出数据驱动型决策。确保监控活动与业务目标相一致的最有效方法之一是,定义和监控关键绩效指标(KPI)。

期望的结果: 与业务目标紧密协调的高效可观测性实践,确保监控工作始终为切实的业务成果服务。

常见反模式:

  • 未定义 KPI:在没有明确 KPI 的情况下工作可能会导致监控过多或过少内容,从而缺少重要信号。

  • 静态 KPI:不会随着工作负载或业务目标的变化而重新审视或完善 KPI。

  • 不一致:重点关注与业务成果不直接相关或难以与现实问题关联的技术指标。

建立此最佳实践的好处:

  • 易于识别问题:业务 KPI 通常比技术指标能够更清楚地揭示问题。与筛查众多技术指标相比,业务 KPI 的下降有助于更有效地查明问题。

  • 业务协调:确保监控活动直接支持业务目标。

  • 效率:将监控资源和注意力优先放在重要的指标上。

  • 积极主动:在问题对业务产生更广泛影响之前识别并解决问题。

未建立这种最佳实践的情况下暴露的风险等级:

实施指导

要有效地定义工作负载 KPI,请执行以下操作:

  1. 从业务成果着手: 在深入研究指标之前,请先了解所需的业务成果。是销售额增加、用户参与度提高还是响应时间更短?

  2. 将技术指标与业务目标相关联: 并非所有技术指标都会对业务结果产生直接影响。确定那些确实会产生直接影响的指标,但使用业务 KPI 来识别问题通常更为简单。

  3. 使用 Amazon CloudWatch 利用 CloudWatch 定义和监控代表您的 KPI 的指标。

  4. 定期审查和更新 KPI: 随着工作负载和业务的发展,保持 KPI 的相关性。

  5. 让利益相关方参与进来: 让技术和业务团队参与定义和审查 KPI。

实施计划的工作量级别:

资源

相关最佳实践:

相关文档:

相关视频:

相关示例: