PERF03-BP03 收集和记录数据存储性能指标 - AWS Well-Architected Framework

PERF03-BP03 收集和记录数据存储性能指标

跟踪并记录数据存储的相关性能指标,了解数据管理解决方案的执行情况。这些指标有助于您优化数据存储,验证是否满足工作负载要求,并清晰地概述工作负载的表现情况。

常见反模式:

  • 您只手动搜索日志文件来查找指标。

  • 您只将指标发布到团队使用的内部工具,而没有全面了解您的工作负载。

  • 您只使用由自己选定的监控软件记录的默认指标。

  • 您只在出现问题时审查指标。

  • 您只监控系统级指标,而不捕获数据访问或使用情况指标。

建立此最佳实践的好处: 建立性能基准有助于了解工作负载的正常行为和需求。可以更快地识别和调试异常模式,从而提高数据存储的性能和可靠性。

未建立这种最佳实践的情况下暴露的风险等级:

实施指导

要监控数据存储的性能,必须记录一段时间的多项性能指标。这样您便可以检测异常并根据业务指标衡量性能,确保满足您的工作负载需求。

指标既应包括支持数据存储的底层系统指标,也应包括数据库指标。底层系统指标可能包括 CPU 利用率、内存、可用磁盘存储、磁盘 I/O、缓存命中率以及网络入站和出站指标,而数据存储指标可能包括每秒事务数、最多的查询、平均查询速率、响应时间、索引使用情况、表锁定、查询超时和打开的连接数。这些数据对于了解工作负载的表现情况以及数据管理解决方案的使用方式至关重要。在数据驱动方法中使用这些指标,以便调整和优化工作负载的资源。 

使用各种工具、库和系统来记录与数据库性能相关的性能测量值。

实施步骤

  1. 确定要跟踪的数据存储关键性能指标。

  2. 使用经批准的日志记录和监控解决方案来收集这些指标。 Amazon CloudWatch 可以收集架构中各种资源的指标。您也可以收集和发布自定义指标,用于显示业务指标或派生指标。使用 CloudWatch 或第三方解决方案来设置指示超出阈值的警报。

  3. 检查数据存储监控,确定其能否受益于可检测性能异常的机器学习解决方案。

    1. Amazon DevOps Guru for Amazon RDS 会显示性能问题,并提出纠正措施的建议。

  4. 在监控和日志记录解决方案中配置数据留存,从而满足您的安全和运营目标。

资源

相关文档:

相关视频:

相关示例: