REL06-BP02 定义与计算指标(聚合) - 可靠性支柱

REL06-BP02 定义与计算指标(聚合)

存储日志数据并在必要时应用筛选条件以计算指标,例如,特定日志事件的数量,或从日志事件时间戳计算得到的延迟。

Amazon CloudWatch 和 Amazon S3 充当主要聚合层和存储层。某些服务(如 AWS Auto Scaling 和 Elastic Load Balancing)针对整个集群或实例,默认情况下为 CPU 负载或平均请求延迟提供了一些默认指标。对于流式处理服务(如 VPC 流日志和 AWS CloudTrail),事件数据将被转发给 CloudWatch Logs,您需要定义和应用指标筛选条件,才能从事件数据中提取指标。这为您提供了时间序列数据,可被输入到您定义的触发提醒的 CloudWatch 警报。

未建立此最佳实践暴露的风险等级:

实施指导

  • 定义与计算指标(聚合)。存储日志数据并在必要时应用筛选条件以计算指标,例如,特定日志事件的数量,或从日志事件时间戳计算得到的延迟

    • 指标筛选条件定义在将日志数据发送到 CloudWatch Logs 中时所查找的术语和模式。CloudWatch Logs 使用这些指标筛选条件将日志数据转换为 CloudWatch 数字指标,您可以对这些指标绘制图形或设置警报。

    • 使用受信任第三方来聚合日志。

      • 遵循第三方的说明。大多数第三方产品可以与 CloudWatch 和 Amazon S3 集成。

    • 某些 AWS 服务可以直接向 Amazon S3 发布日志。如果您的主要需求是将日志存储在 Amazon S3 中,则可以让生成日志的服务轻松将其直接发送至 Amazon S3,无需设置额外的基础设施。

资源

相关文档: