OPS08-BP05 创建控制面板 - 卓越运营支柱

OPS08-BP05 创建控制面板

控制面板是以人为本的视图,可用于查看工作负载的遥测数据。虽然它们提供了重要的可视化界面,但它们不应取代警报机制,而是补充警报机制。如果精心设计,它们不仅能迅速洞察系统的运行状况和性能,还能为利益相关方提供有关业务成果和问题影响的实时信息。

期望结果:

使用可视化形式,清晰地了解系统和业务运行状况,并可据此采取行动。

常见反面模式:

  • 指标过多,使得控制面板过于复杂。

  • 依靠的控制面板不会对检测到的异常情况发出警报。

  • 不会随着工作负载的演进而更新控制面板。

这种最佳实践的好处:

  • 即时了解关键系统指标和 KPI。

  • 增进利益相关方的沟通和理解。

  • 快速洞察运营问题的影响。

未建立这种最佳实践的情况下的风险等级:中等

实施指导

以业务为中心的控制面板

为业务 KPI 量身定制的控制面板可吸引更广泛的利益相关方。尽管这些人可能对系统指标不感兴趣,但他们热衷于了解这些数字对业务的影响。以业务为中心的控制面板可确保所监控和分析的所有技术和运营指标与总体业务目标同步。这种一致性可让每个人了解什么是至关重要的,什么不太重要,并就此达成共识。此外,突出业务 KPI 的控制面板往往更具操作性。利益相关方可以快速了解运营状况、需要关注的领域以及对业务成果的潜在影响。

考虑到这一点,在创建控制面板时,请确保技术指标和业务 KPI 之间保持平衡。两者都至关重要,但它们面向不同的受众。理想情况下,您拥有的控制面板应该有助于您全面了解系统的运行状况和性能,同时还要强调关键业务成果及其影响。

Amazon CloudWatch 控制面板是 CloudWatch 控制台中的可自定义主页,方便您通过单一视图监控您的资源,即使这些资源分布在不同 AWS 区域和账户中。

实施步骤

  1. 创建基本控制面板:在 CloudWatch 中创建新控制面板,为其指定一个描述性名称。

  2. 使用 Markdown 小部件:在深入研究指标之前,使用 Markdown 小部件在控制面板顶部添加文字背景信息。这应该解释控制面板涵盖的内容、所表示的指标的重要性,还可以包含指向其他控制面板和故障排除工具的链接。

  3. 创建控制面板变量:适当时纳入控制面板变量,以创建动态和灵活的控制面板视图。

  4. 创建指标小部件:添加指标小部件,以可视化形式呈现应用程序发出的各种指标,定制这些小部件以有效呈现系统运行状况和业务成果。

  5. Log Insights 查询:利用 CloudWatch Log Insights 从日志中获取可操作的指标,并在控制面板上显示这些见解。

  6. 设置警报:CloudWatch Alarms 集成到您的控制面板,可以快速查看任何超出阈值的指标。

  7. 使用 Contributor Insights:纳入 CloudWatch Contributor Insights 来分析高基数字段,并更清楚地了解您的资源的主要贡献者。

  8. 设计自定义小部件:如果标准小部件无法满足特定需求,可以考虑创建自定义小部件。自定义小部件可以从各种数据来源中提取数据,也可以以独特方式表示数据。

  9. 使用 AWS Health Dashboard:使用 AWS Health Dashboard 深入了解您的账户健康状况、事件,以及即将发生、可能影响您的服务和资源的变更。您还可以集中查看 AWS Organizations 中的运行状况事件,或者构建自己的自定义控制面板(有关更多详细信息,请参阅相关示例)。

  10. 迭代和完善:随着应用程序的演进,请定期重新审视控制面板以确保其仍然适用。

资源

相关最佳实践:

相关文档:

相关视频:

相关示例: