适用于 DevOps RDS 的 Guru 的关键概念 - Amazon DevOps Guru

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

适用于 DevOps RDS 的 Guru 的关键概念

DevOpsGuru 在您的操作应用程序中检测到异常或有问题的行为时,就会生成见解。见解包含一个或多个资源的异常。异常表示 DevOps Guru 检测到的一个或多个意外或异常的相关指标。

见解的严重性分为。见解的严重性由促成该见解的最严重异常所决定。例如,如果洞察 AWS-ECS_ MemoryUtilization _and_others 包含一个严重性较低的异常和另一个严重性较高的异常,则该洞察的总体严重性为高。

如果 Amazon RDS 数据库实例启用了 Performance Insights,则 DevOps Guru for RDS 会针对这些实例的异常情况提供详细的分析和建议。为了识别异常情况, DevOpsGuru for RDS 为数据库指标值制定了基准。 DevOps然后,Guru for RDS 将当前指标值与历史基线进行比较。

主动见解

主动见解可以让您在问题发生之前了解问题行为。它包含异常情况以及建议和相关指标,可以帮助您解决 Aurora 数据库中的问题,以免问题变得更严重。

每个主动见解页面都提供有关一个异常的详细信息。

被动见解

被动见解可在异常行为发生时识别此类行为。它包含异常以及建议、相关指标和事件,可帮助您立即了解和解决问题。

因果异常

因果异常是被动见解内的一项顶级异常。它在 DevOps Guru 控制台的异常详细信息页面上显示为主要指标数据库负载(数据库负载)是 DevOps Guru for RDS 的因果异常。例如,见解 AWS-ECS_ MemoryUtilization _and_ot hers 可能有多个指标异常,其中一个是资源 AWS/RDS 的数据库负载(数据库负载)。

在见解中,多个 Amazon RDS 数据库实例可能会出现异常数据库负载(DB 负载)。异常的严重性对每个数据库实例都可能不同。例如,一个数据库实例的严重性可能为高,而其他数据库实例的严重性可能为低。控制台默认为严重性最高的异常。

上下文异常

上下文异常数据库负载(DB 负载)内与被动见解相关的一项调查结果。它显示在 DevOps Guru 控制台异常详情页面的相关指标部分中。每个上下文异常都描述了需要调查的特定 Amazon RDS 性能问题。例如,因果异常可能包括以下上下文异常:

  • 超出 CPU 容量 — CPU 运行队列或 CPU 利用率高于正常水平。

  • 数据库内存不足 — 进程没有足够的内存。

  • 数据库连接峰值 – 数据库连接数量超过正常值。

建议

每个见解至少有一个建议的操作。以下示例是 DevOps Guru 为 RDS 生成的建议:

  • 调整 SQL IDs list_of_IDs 以降低 CPU 使用率,或者升级实例类型以增加 CPU 容量。

  • 查看当前数据库连接的相关峰值。考虑调整应用程序池设置,以避免频繁地动态分配新的数据库连接。

  • 查找执行过多内存操作(例如内存中排序或大型连接)的 SQL 语句。

  • 调查以下 SQL ID 的大量 I/O 使用情况:list_of_IDs

  • 检查是否存在创建大量临时数据的语句,例如那些执行大量排序或使用大型临时表的语句。

  • 检查应用程序以了解导致数据库工作负载增加的原因。

  • 考虑启用 MySQL 性能架构。

  • 检查是否存在长时间运行的事务,然后以提交或回滚将其结束。

  • 配置 idle_in_transaction_session_timeout 参数,以结束处于“空闲事务”状态超过指定时间的任何会话。