系统级 CloudWatch 配置 - AWS 规范性指导

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

系统级 CloudWatch 配置

系统级指标和日志是监控和记录解决方案的核心组成部分, CloudWatch 代理有适用于 Windows 和 Linux 的特定配置选项。

我们建议使用CloudWatch 配置文件向导或配置文件架构来定义 CloudWatch 计划支持的每个操作系统的代理配置文件。其他特定于工作负载的操作系统级日志和指标可以在单独的中定义 CloudWatch 配置文件并附加到标准配置中。这些唯一的配置文件应单独存储在 S3 存储桶中,您的 EC2 实例可以在其中检索它们。为此目的设置 S3 存储桶的示例在管理 CloudWatch配置本指南的部分。您可以使用州管理器和分销商自动检索和应用这些配置。

配置系统级日志

系统级日志对于诊断和故障排除本地或在AWS云。您的日志捕获方法应包括操作系统生成的所有系统和安全日志。操作系统生成的日志文件可能因操作系统版本而异。

这些区域有: CloudWatch 代理支持通过提供事件日志名称来监视 Windows 事件日志。你可以选择要监视的 Windows 事件日志(例如SystemApplication,或者Security)。

Linux 系统的系统、应用程序和安全日志通常存储在/var/log目录。下表定义了应监控的常见默认日志文件,但是您应该检查/etc/rsyslog.conf要么/etc/syslog.conf文件来确定系统日志文件的具体设置。

Fedora 分配

(Amazon Linux、CentOS、Red Hat Enterprise Linux)

/var/log/boot.log*— 启动日志

/var/log/dmesg— 内核日志

/var/log/secure— 安全和身份验证日志

/var/log/messages— 常规系统日志

/var/log/cron*— Cron 日志

/var/log/cloud-init-output.log— 来自的输出Userdata启动脚本

Debian

(Ubuntu)

/var/log/syslog— 启动日志

/var/log/cloud-init-output.log— 来自的输出Userdata启动脚本

/var/log/auth.log— 安全和身份验证日志

/var/log/kern.log— 内核日志

您的组织可能还有其他代理或系统组件来生成要监控的日志。您应评估并决定这些代理或应用程序生成的日志文件,并通过标识它们的文件位置将它们包含在配置中。例如,您应该包括 Systems Manager 和 CloudWatch 代理登录到您的配置中。下表提供了 Windows 和 Linux 的这些代理日志的位置。

Windows CloudWatch 代理

$Env:ProgramData\Amazon\AmazonCloudWatchAgent\Logs\amazon-cloudwatch-agent.log

Systems Manager 代理

%PROGRAMDATA%\Amazon\SSM\Logs\amazon-ssm-agent.log

%PROGRAMDATA%\Amazon\SSM\Logs\errors.log

%PROGRAMDATA%\Amazon\SSM\Logs\audits\amazon-ssm-agent-audit-YYYY-MM-DD

Linux CloudWatch 代理

/opt/aws/amazon-cloudwatch-agent/logs/amazon-cloudwatch-agent.log

Systems Manager 代理

/var/log/amazon/ssm/amazon-ssm-agent.log

/var/log/amazon/ssm/errors.log

/var/log/amazon/ssm/audits/amazon-ssm-agent-audit-YYYY-MM-DD

如果日志文件在 CloudWatch 代理配置但未找到。当您想为 Linux 维护单个日志配置时,这非常有用,而不是为每个发行版维护单独的配置。当代理或软件应用程序开始运行之前日志文件不存在时,它也很有用。

配置系统级指标

Amazon EC2 提供的标准指标中不包括内存和磁盘空间利用率。要包括这些指标,您必须安装并配置 CloudWatch EC2 实例上的代理。这些区域有: CloudWatch 代理配置向导创建 CloudWatch 使用的配置预定义指标您可以根据需要添加或删除指标。确保您查看预定义的指标集以确定所需的适当级别。

最终用户和工作负载所有者应根据服务器或 EC2 实例的特定要求发布其他系统指标。应将这些指标定义存储、版本化和维护在单独的 CloudWatch 代理配置文件,并在中心位置(例如 Amazon S3)共享,以便重复使用和自动化。

标准 Amazon EC2 指标不会在本地服务器中自动捕获。这些指标必须在 CloudWatch 本地实例使用的代理配置文件。您可以使用 CPU 利用率等指标为本地实例创建单独的指标配置文件,并将这些指标附加到标准指标配置文件中。