监控工具 - Amazon Elastic Container Service

监控工具

AWS 提供各种可以用来监控 Amazon ECS 的工具。您可以配置其中的一些工具来为您执行监控任务,但有些工具需要手动干预。建议您尽可能实现监控任务自动化。

自动监控工具

您可以使用以下自动化监控工具来监控 Amazon ECS,并在出现错误时进行报告:

  • Amazon CloudWatch 告警 – 按您指定的时间段观察单个指标,并根据相对于给定阈值的指标值在若干时间段内执行一项或多项操作。具体操作是:通知已发送到 Amazon Simple Notification Service (Amazon SNS) 主题或 Amazon EC2 Auto Scaling 策略。CloudWatch 告警不调用操作,因为这些操作处于特定状态;状态必须改变并保持指定时间。有关更多信息,请参阅Amazon ECS CloudWatch 指标

    对于具有使用 EC2 启动类型的任务或服务的集群,您可以使用 CloudWatch 警报来根据 CloudWatch 指标(例如集群内存预留)横向缩减和横向扩展容器实例。

  • Amazon CloudWatch Logs – 通过在任务定义中指定 awslogs 日志驱动程序,监控、存储和访问来自 Amazon ECS 任务中的容器的日志文件。有关更多信息,请参阅使用 awslogs 日志驱动程序

    您也可以从 Amazon ECS 容器实例监控、存储和访问操作系统及 Amazon ECS 容器代理日志文件。这种访问日志的方法可以用于使用 EC2 启动类型的容器。有关更多信息,请参阅监控您的容器实例

  • Amazon CloudWatch Events – 匹配事件并将事件传送到一个或多个目标函数或流,进行更改、捕获状态信息和采取纠正措施。有关更多信息,请参阅本指南中的 Amazon ECS 事件和 EventBridge 以及 Amazon CloudWatch Events 用户指南中的什么是 Amazon CloudWatch Events?

  • AWS CloudTrail 日志监控 – 在账户间共享日志文件,通过将 CloudTrail 日志文件发送到 CloudWatch Logs 来进行实时监控,用 Java 编写日志处理应用程序,验证 CloudTrail 提供的日志文件未发生更改。有关更多信息,请参阅本指南中的 使用 AWS CloudTrail 记录 Amazon ECS API 调用AWS CloudTrail用户指南中的使用 CloudTrail 日志文件

手动监控工具

监控 Amazon ECS 的另一个重要环节是手动监控 CloudWatch 警报未涵盖的那些项。CloudWatch、Trusted Advisor 和其他 AWS 控制台控制面板提供 AWS 环境状态的概览视图。建议您也可以查看容器实例上的日志文件以及任务中的容器。

  • CloudWatch 主页:

    • 当前告警和状态

    • 告警和资源图表

    • 服务运行状况

    此外,您还可以使用 CloudWatch 执行以下操作:

    • 创建自定义控制面板以监控您关心的服务。

    • 绘制指标数据图,以排除问题并弄清楚趋势。

    • 搜索并浏览您所有的 AWS 资源指标。

    • 创建和编辑警报以接收有关问题的通知。

  • AWS Trusted Advisor 可以帮助您监控 AWS 资源以提高性能、可靠性、安全性和成本效益。四个 Trusted Advisor 检查可供所有用户使用;超过 50 个检查可供具有“商业”或“企业”支持计划的用户使用。有关更多信息,请参阅AWS Trusted Advisor

  • AWS Compute Optimizer 是一种服务,用于分析 AWS 资源的配置和利用率指标。它将报告您的资源是否处于最佳状态并生成优化建议,以降低成本并提高工作负载的性能。

    有关更多信息,请参阅AWS Compute Optimizer 建议