OPS08-BP03 分析工作负载跟踪数据 - AWS Well-Architected 框架

OPS08-BP03 分析工作负载跟踪数据

分析跟踪数据对于全面了解应用程序的操作过程至关重要。通过以可视化方式呈现和理解各个组件之间的交互情况,可以微调性能,识别瓶颈并增强用户体验。

期望结果:清晰地了解应用程序的分布式操作,从而更快地解决问题并增强用户体验。

常见反模式:

  • 忽略跟踪数据,仅依赖日志和指标。

  • 不将跟踪数据与关联日志联系起来。

  • 忽略从跟踪数据中得出的指标,例如延迟和故障率。

建立此最佳实践的好处:

  • 改善故障排除并缩短平均解决时间(MTTR)。

  • 深入了解依赖项及其影响。

  • 迅速发现并纠正性能问题。

  • 利用从跟踪数据中得出的指标作出明智的决策。

  • 通过优化的组件交互来改善用户体验。

在未建立这种最佳实践的情况下暴露的风险等级:

实施指导

AWS X-Ray 提供了分析跟踪数据的完整套件,可提供服务交互的整体视图、监控用户活动并检测性能问题。ServiceLens、X-Ray Insights、X-Ray Analytics 和 Amazon DevOps Guru 等功能,可增强从跟踪数据中获得的可行洞察的深度。

实施步骤

以下步骤提供了一种结构化方法,以便使用 AWS 服务有效地实施跟踪数据分析:

  1. 集成 AWS X-Ray:确保 X-Ray 已与应用程序集成,以便捕获跟踪数据。

  2. 分析 X-Ray 指标:使用服务地图深入研究从 X-Ray 跟踪数据中得出的指标,例如延迟、请求率、故障率和响应时间分布等,以便监控应用程序的运行状况。

  3. 使用 ServiceLens:利用 ServiceLens 地图增强服务和应用程序的可观测性。这允许以集成方式查看跟踪数据、指标、日志、警报和其他运行状况信息。

  4. 启用 X-Ray Insights

    1. 开启 X-Ray Insights,可自动检测跟踪数据中的异常情况。

    2. 研究洞察以查明模式并确定根本原因,例如故障率或延迟增加。

    3. 查阅洞察时间表,按时间顺序分析检测到的问题。

  5. 使用 X-Ray AnalyticsX-Ray Analytics 允许全面探索跟踪数据、查明模式并提取洞察。

  6. 使用 X-Ray 中的组:在 X-Ray 中创建组,根据高延迟等标准筛选跟踪数据,从而进行更有针对性的分析。

  7. 加入 Amazon DevOps Guru:利用 Amazon DevOps Guru 从机器学习模型中受益,查明跟踪数据中的操作异常。

  8. 使用 CloudWatch Synthetics:使用 CloudWatch Synthetics 创建用于持续监控端点和工作流程的金丝雀。这些金丝雀可以与 X-Ray 集成来提供跟踪数据,用于对正在测试的应用程序进行深入分析。

  9. 使用真实用户监控(RUM):借助 AWS X-Ray 和 CloudWatch RUM,可以分析和调试从应用程序的终端用户开始,经过下游 AWS 托管服务的请求路径。可帮助您识别影响最终用户的延迟趋势和错误。

  10. 与日志关联:将跟踪数据与 X-Ray 跟踪视图中的相关日志关联,从而详细了解应用程序行为。这允许查看与跟踪的事务直接关联的日志事件。

  11. 实施 CloudWatch 跨账户可观测性监控跨越一个区域内多个账户的应用程序并对其进行故障排除。

实施计划的工作量级别:

资源

相关最佳实践:

相关文档:

相关视频:

相关示例: