使用 DevOps Guru 中的见解 - Amazon DevOps Guru

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 DevOps Guru 中的见解

Amazon DevOps Guru 在检测到操作应用程序中的异常行为时会生成见解。DevOps Guru 会分析您在设置 DevOps Guru 时指定的AWS资源中的指标、事件等。每项见解都包含一项或多项建议,可用来缓解问题。它还包含指标列表、日志组列表以及用于识别异常行为的事件列表。

见解有两种类型。

  • 被动见解提供可以用来解决当前正在发生的问题的建议。

  • 主动见解提供可用来处理 DevOps Guru 预测将来会出现的问题的建议。

查看 DevOps Guru 见解

您可以使用AWS Management Console来查看见解。

查看 DevOps Guru 见解
  1. 打开 Amazon DevOps Guru 控制台,网址为 https://console.aws.amazon.com/devops-guru/

  2. 打开导航窗格,然后选择 Cost Insights

  3. 被动选项卡上,您可以看到被动见解的列表。在主动选项卡上,您可以看到主动见解的列表。

  4. (可选)使用以下一个或多个筛选条件来查找您要寻找的见解。

    • 根据要查找的见解类型,选择被动主动选项卡。

    • 选择筛选见解,然后选择一个选项来指定一个筛选器。您可以添加状态、严重性、资源和标签筛选器的组合。使用AWS标签筛选器查看仅由带特定标签的资源生成的见解。要了解更多信息,请参阅 使用标签来识别 DevOps Guru 应用程序中的资源

    注意

    DevOps Guru 可以分析以下资源,但无法使用标签筛选其见解。

    • Amazon API Gateway 路径和路由

    • Amazon DynamoDB Streams

    • Amazon EC2 Auto Scaling 组实例

    • AWS Elastic Beanstalk 环境

    • Amazon Redshift 节点

    • 选择或指定要按见解创建时间进行筛选的时间范围。

      • 12h 显示过去 12 小时创建的见解。

      • 1d 显示过去一天创建的见解。

      • 1w 显示过去一周创建的见解。

      • 1m 显示过去一个月创建的见解。

      • 自定义允许您指定其他时间范围。可用于筛选见解的最大时间范围为 180 天。

  5. 要查看见解的详细信息,请选择其名称。

了解 DevOps Guru 控制台中的见解

使用 Amazon DevOps Guru 控制台查看见解中的有用信息,以帮助诊断和处理异常行为。当 DevOps Guru 分析您的资源并找到表明异常行为的相关 Amazon CloudWatch 指标、AWS CloudTrail事件和操作数据时,它会生成一个见解,其中包含解决问题的建议以及有关相关指标和事件的信息。使用见解数据DevOps Guru 中的最佳实践解决 DevOps Guru 检测到的操作问题。

要查看见解,请按照查看见解中的步骤查找见解,然后选择其名称。见解页面包括以下详细信息。

见解概述

使用本节可获得对见解的高层次概述。您可以查看见解的状态(持续已关闭)、AWS CloudFormation堆栈受影响的数量、见解开始、结束和上次更新的时间,以及相关的操作项(如果有)。

如果在堆栈级别对见解进行分组,则可以选择受影响的堆栈数量来查看其名称。产生见解的异常行为出现在受影响堆栈创建的资源中。如果在账户级别对见解进行分组,则数量为零或不显示。

有关更多信息,请参阅了解异常行为如何分组为见解

见解名称

见解的名称取决于它是按堆栈级别还是按账户级别分组的。

  • 堆栈级别的见解名称包括包含具有异常行为的资源的堆栈的名称。

  • 账户级别的见解名称不包含堆栈名称。

有关更多信息,请参阅了解异常行为如何分组为见解

聚合指标

选择聚合指标选项卡以查看与见解相关的指标。在表格中,每行代表一个指标。您可以看到哪个AWS CloudFormation堆栈创建了发出该指标的资源、资源的名称及其类型。并非所有指标都与AWS CloudFormation堆栈相关联或有名称。

当同时存在多个异常资源时,时间轴视图会聚合资源并在单个时间轴中显示其异常指标,以便于分析。时间轴上的红线表示指标发出异常值的时间跨度。要放大,请使用鼠标选择特定的时间范围。也可以使用放大镜图标放大和缩小。

选择时间轴中的一条红线以查看详细信息。在打开的窗口中,您可以:

  • 选择在 CloudWatch 中查看可查看该指标在 CloudWatch 控制台中的显示效果。有关更多信息,请参阅Amazon CloudWatch 用户指南中的统计信息尺寸

  • 将鼠标悬停在图表上方可查看有关异常指标数据及其出现时间的详细信息。

  • 选择带有向下箭头的方框可下载图表的 PNG 图像。

图表化异常

选择图表化异常选项卡可查看每个见解异常的详细图表。每个异常都会显示一个图块,其中包含相关指标中检测到的异常行为的详细信息。您可以在资源级别和每个统计数据中调查和查看异常。图表按指标名称进行分组。在每个图块中,您可以选择时间轴中的特定时间范围进行缩放。您也可以使用放大镜图标进行放大和缩小,或者选择以小时、天或周为单位的预定义持续时间(1H3H12H1D3D1W 或 2W)。

选择查看所有统计数据和维度以查看有关异常的详细信息。在打开的窗口中,您可以:

  • 选择在 CloudWatch 中查看可查看该指标在 CloudWatch 控制台中的显示效果。

  • 将鼠标悬停在图表上方可查看有关异常指标数据及其出现时间的详细信息。

  • 选择统计数据维度以自定义图表的显示方式。有关更多信息,请参阅Amazon CloudWatch 用户指南中的统计信息尺寸

日志组

启用日志异常检测后,DevOps Guru 会标记您的 CloudWatch 日志组,以便您可以查看与见解相关的日志组。在见解详情页面的日志组部分,表中的每一行代表一个日志组并列出了相关资源。

当同时存在多个异常日志组时,时间轴视图会将它们聚合在单个时间轴中,以便于分析。时间轴上的紫线表示日志组遇到日志异常的时间跨度。

在时间轴中选择一条紫线可查看日志异常信息示例,例如关键字异常和数值偏差。选择查看日志组详细信息以查看日志异常。在打开的窗口中,您可以:

  • 查看日志异常和相关事件的图表。

  • 将鼠标悬停在图表上可查看有关异常日志数据及其发生时间的详细信息。

  • 详细地查看日志异常,包括示例消息、出现频率、相关建议和出现时间。

  • 点击在 CloudWatch 查看详细信息,以查看异常日志中的日志行。

相关事件

相关事件中,查看与见解相关的AWS CloudTrail事件。使用这些事件来帮助了解、诊断和解决异常行为的根本原因。

建议

建议中,可以查看可能有助于您解决潜在问题的建议。当 DevOps Guru 检测到异常行为时,它会尝试创建建议。见解可能包含一个、多个或零个建议。

了解异常行为如何分组为见解

见解按堆栈级别账户级别进行分组。如果为AWS CloudFormation堆栈中的资源生成了见解,则它是堆栈级别的见解。否则,它是账户级别的见解。

堆栈的分组方式可能取决于如何在 Amazon DevOps Guru 中配置资源分析涵盖范围。

如果涵盖范围是由AWS CloudFormation堆栈定义的

将分析所选堆栈中包含的所有资源,并将所有检测到的见解按堆栈级别进行分组。

如果涵盖范围是当前的AWS账户和区域

将分析您的账户和区域中的所有资源,检测到的见解有三种可能的分组方案。

  • 从不属于堆栈的资源生成的见解按账户级别进行分组。

  • 从处于前 10,000 个已分析堆栈的一个堆栈中的资源生成的见解按堆栈级别进行分组。

  • 从一个不在前 10,000 个已分析堆栈的堆栈的资源生成的见解按账户级别进行分组。例如,为第 10,001 个已分析堆栈中的资源生成的见解按账户级别进行分组。

有关更多信息,请参阅确定 DevOps Guru 的覆盖范围

了解见解严重性

见解可以有三种严重性之一,即。Amazon DevOps Guru 在检测到相关异常并为每个异常分配严重性后,才会创建见解。DevOps Guru 利用领域知识和多年的集体经验,将异常的严重性分为。见解的严重性由导致创建见解的最严重异常决定。

  • 如果生成见解的所有异常的严重性都为,则该见解的严重性为

  • 如果生成见解的所有异常的最高严重性为,则该见解的严重性为。产生见解的某些异常的严重性可能为

  • 如果生成见解的所有异常的最高严重性为,则该见解的严重性为。产生见解的某些异常的严重程度可能为