OPS08-BP05 创建仪表板 - AWS Well-Architected 框架

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

OPS08-BP05 创建仪表板

控制面板是以人为本的视图,可用于查看工作负载的遥测数据。虽然控制面板提供了重要的可视化界面,但不应取代警报机制,而是作为警报机制的补充。经过精心设计的控制面板不仅能迅速洞察系统的运行状况和性能,还能为利益相关方提供有关业务成果和问题影响的实时信息。

期望结果:

使用可视化形式,清晰地了解系统和业务运行状况,并据此采取行动。

常见反模式:

  • 指标过多,控制面板过于复杂。

  • 依靠没有警报功能的控制面板进行异常检测。

  • 不会随着工作负载的发展变化而更新控制面板。

此最佳实践的好处:

  • 即时了解关键系统指标,以及KPIs.

  • 增进利益相关方的沟通和理解。

  • 快速洞察运营问题的影响。

在未建立这种最佳实践的情况下暴露的风险等级:

实施指导

以业务为中心的控制面板

为企业量身定制的仪表板KPIs吸引了更广泛的利益相关者。尽管这些人可能对系统指标不感兴趣,但他们热衷于了解这些数字对业务的影响。以业务为中心的控制面板可确保所监控和分析的所有技术和运营指标与总体业务目标同步。这种一致性可让每个人清楚了解什么是至关重要的,什么不太重要,并就此达成共识。此外,突出显示业务的仪表板KPIs往往更具操作性。利益相关方可以快速了解运营状况、需要关注的领域以及对业务成果的潜在影响。

考虑到这一点,在创建仪表板时,请确保在技术指标和业务之间取得平衡KPIs。两者都至关重要,但它们面向不同的受众。理想情况下,控制面板应该有助于全面了解系统的运行状况和性能,同时还要强调关键业务成果及其影响。

A CloudWatch mazon Dashboards 是 CloudWatch 控制台中可自定义的主页,您可以使用它在单一视图中监控您的资源,甚至是分布在不同 AWS 区域 账户中的资源。

实施步骤

  1. 创建基本仪表板:在中创建新的仪表板 CloudWatch,并给它起一个描述性的名称。

  2. 使用 Markdown 小组件:在深入研究指标之前,请使用 Markdown 小组件在控制面板顶部添加文本上下文。文本上下文应该说明控制面板涵盖的内容、所呈现指标的重要性,还可以包含指向其他控制面板和故障排除工具的链接。

  3. 创建控制面板变量:在适当的地方加入控制面板变量,从而实现动态和灵活的控制面板视图。

  4. 创建指标小组件:添加指标小组件,以可视化形式呈现应用程序发出的各种指标,定制这些小组件,以便有效呈现系统运行状况和业务成果。

  5. Log Insights 查询:利用 CloudWatchLog Insigh ts 从日志中获取可操作的指标,并在仪表板上显示这些见解。

  6. 设置警报:CloudWatch警报集成到您的控制面板中,以便快速查看任何突破其阈值的指标。

  7. 使用 “贡献者见解:整合CloudWatch贡献者见解” 来分析高基数字段,更清楚地了解资源的主要贡献者。

  8. 设计自定义小组件:对于标准小组件无法满足的特定需求,可以考虑创建自定义小组件。自定义小部件可以从各种数据来源中提取数据,也可以以独特方式呈现数据。

  9. 使用 AWS Health Dashboard:AWS Health Dashboard用于更深入地了解您的账户运行状况、事件以及可能影响您的服务和资源的即将发生的更改。还可以集中查看 AWS Organizations 中的运行状况事件,或者构建自己的自定义控制面板(有关更多详细信息,请参阅相关示例)。

  10. 迭代和完善:随着应用程序的发展,请定期重新审视控制面板,确保其仍然适用。

资源

相关最佳实践:

相关文档:

相关视频:

相关示例: