监控 Amazon EC2 - Amazon Elastic Compute Cloud

监控 Amazon EC2

监控是保持 Amazon Elastic Compute Cloud (Amazon EC2) 实例和AWS解决方案的可靠性、可用性和性能的重要部分。您的 AWS 解决方案的所有组成部分都应收集监控数据,以便更轻松地调试出现的多点故障。但是,在开始监控 Amazon EC2 前,您应创建包括以下内容的监控计划:

  • 您的监控目标是什么?

  • 您将监控哪些资源?

  • 监控这些资源的频率如何?

  • 您将使用哪些监控工具?

  • 谁负责执行监控任务?

  • 出现错误时应通知谁?

在定义监控目标并创建监控计划后,下一步是在您的环境中建立正常 Amazon EC2 性能的基准。您应该在不同时间和不同负载条件下测量 Amazon EC2 的性能。监控 Amazon EC2 时,您应存储所收集的监控数据的历史记录。您可将当前 Amazon EC2 性能与这些历史数据进行比较,这样可帮助您确定性能的正常模式和异常模式,找出解决问题的方法。例如,您可以监控 EC2 实例的 CPU 使用率、磁盘 I/O 和网络使用率。如果性能低于您所建立的基准,则您可能需要重新配置或优化实例以降低 CPU 使用率、改进磁盘 I/O 或减少网络流量。

要建立基准,您至少应监控以下各项:

要监控的项目 Amazon EC2 指标 监控代理/CloudWatch Logs

CPU 使用率

CPU 利用率

网络使用率

NetworkIn

网络输出

磁盘性能

磁盘读取操作

磁盘写入操作

磁盘读取/写入

磁盘读取字节数

磁盘写入字节数

内存利用率、磁盘交换利用率、磁盘空间利用率、页面文件利用率、日志收集

[Linux 和 Windows Server 实例] 使用 CloudWatch 代理从 Amazon EC2 实例和本地服务器收集指标和日志

[在 Windows Server 实例上从以前的 CloudWatch Logs 代理迁移] 将 Windows Server 实例日志收集迁移到 CloudWatch 代理