DevOps Guru 中的最佳实践 - Amazon DevOps Guru

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

DevOps Guru 中的最佳实践

以下最佳实践可帮助理解、诊断和修复 Amazon DevOps Guru 检测到的异常行为。通过了解 DevOps Guru 控制台中的见解,使用最佳实践处理 DevOps Guru 检测到的操作问题。

  • 在见解的时间轴视图中,首先查看突出显示的指标。它们通常是问题的关键指标。

  • 使用 Amazon CloudWatch 查看在见解中第一个高亮显示的指标之前出现的指标,以确切查明行为何时以及如何变化的。这可以帮助您诊断和解决问题。

  • 要获取 Amazon RDS 资源,请查看“性能详情”指标。通过将计数器指标与数据库负载相关联,可以获得有关性能问题的详细信息。有关更多信息,请参阅使用 DevOps Gurufor Amazon RDS 分析性能异常

  • 同一指标的多个维度通常是异常的。查看图形视图中的维度,以更深入地了解问题。

  • 在见解的事件部分查看创建见解时发生的部署或基础架构事件。了解在见解出现异常行为时发生了哪些事件可以帮助您了解和诊断问题。

  • 在操作系统中寻找与线索见解差不多同时出现的工单。

  • 在见解中,阅读建议并访问建议中的链接。这些通常包含故障排除步骤,可以帮助您快速诊断和解决问题。

  • 除非已经解决了问题,否则不要忽略已解决的见解。每天一次,查看新的见解,即使这些见解已经得到解决。尝试尽可能多地了解这些见解背后的根本原因。寻找一种可能是系统性问题征兆的模式。如果系统性问题得不到解决,它将来可能会造成更严重的问题。立即修复暂时性问题可以帮助防止将来发生更严重的事件。