PERF02-BP03 收集与计算相关的指标
记录和跟踪与计算相关的指标,以便更好地了解计算资源的表现情况,并提高计算资源的性能和利用率。
常见反模式:
-
只手动搜索日志文件来查找指标。
-
只使用由监控软件记录的默认指标。
-
只在出现问题时审查指标。
建立此最佳实践的好处:收集与性能相关的指标有助于您根据业务要求调整应用程序性能,从而确保满足工作负载需求。收集指标还有利于您持续提高工作负载中的资源性能和利用率。
在未建立这种最佳实践的情况下暴露的风险等级:高
实施指导
云工作负载会生成大量数据,例如指标、日志和事件。在 AWS Cloud 中,收集指标是提高安全性、成本效率、性能和可持续性的关键步骤。AWS 使用监控服务(如 Amazon CloudWatch
实施步骤
-
确定哪些与性能相关的指标与您的工作负载相关。您应该收集有关资源利用率和云工作负载运行方式的指标(例如响应时间和吞吐量)。
-
为工作负载选择并设置合适的日志记录和监控解决方案。
-
根据工作负载要求为指标确定所需的筛选和聚合。
-
为指标配置数据留存策略,从而符合安全目标和运营目标。
-
如有需要,可为指标创建警报和通知,协助您主动应对与性能相关的问题。
-
使用自动化技术来部署指标和日志聚合代理。
资源
相关文档:
相关视频:
相关示例: