使用 ML 支持的异常检测和贡献分析探索异常值和关键驱动因素 - Amazon QuickSight

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 ML 支持的异常检测和贡献分析探索异常值和关键驱动因素

您可以通过交互方式探索分析中的异常(也称为异常值)以及贡献因素(关键驱动因素)。可在 ML 支持的异常检测运行后探索该分析。您在此屏幕中所做的更改,在返回分析时不保存。

首先,在洞察中选择探索异常。以下屏幕截图显示了首次打开异常屏幕时显示的画面。在此示例中,设置了贡献者分析,并显示了两个关键驱动因素。

显示了贡献者的异常分析。

屏幕的各个部分从左上到右下包括以下内容:

  • 贡献者显示关键驱动因素。要查看此部分,您需要在异常配置中设置贡献者。

  • 控件包含异常探索的设置。

  • 异常的数量显示一段时间内检测到的异常值。您可以隐藏或显示此图表部分。

  • 您的类别或维度字段的字段名称用作显示每个类别或维度异常的图表的标题。

以下部分提供探索异常的各个方面的详细信息。

探索贡献者(关键驱动因素)

如果您的异常洞察设置为检测关键驱动因素,则 QuickSight 运行贡献分析以确定哪些类别(维度)正在影响异常值。贡献者部分显示在左侧。

贡献者面板。

贡献者包含以下部分:

  • 叙述 – 左上角有一个摘要,描述了指标的任何变化。

  • 排名靠前的贡献者配置 – 选择配置来更改要在此部分中使用的贡献者和日期范围。

  • 排序依据 – 设置应用于下面显示的结果的排序。可从以下选项中进行选择:

    • Absolute difference (绝对差异)

    • Contribution percentage (贡献百分比)(默认)

    • Deviation from expected (与预期的偏差)

    • Percentage difference (差额百分比)

  • 排名靠前的贡献者的结果 – 显示在右侧时间轴上选择的时间点的最高贡献者分析的结果。

    贡献分析可识别某个异常的最多四个主要的贡献因素或关键驱动因素。例如,Amazon QuickSight 可以向您展示促成健康产品在美国销售激增的主要客户。当您配置异常时,只有选择在贡献分析中包括字段时才会显示此面板。

    如果此面板未显示而您希望显示,则可以开启它。为此,请转到分析,从洞察的菜单中选择异常配置,然后最多选择四个字段来分析贡献。如果您在排除贡献驱动因素的工作表控件中进行更改,则贡献面板将关闭。

异常检测的设置控件

您可以在屏幕的控件部分找到异常检测的设置。您可以通过单击控件一词打开和关闭此部分。

选择控件打开“控件”部分。

其中包括以下设置:

  • 控件 – 当前设置显示在工作区的顶部。您可以通过选择右侧的双箭头图标展开此部分。以下设置可用于探索由 ML 支持的异常检测生成的异常值:

    • 严重性 – 设置探测器对检测到的异常(异常值)的敏感程度。在将阈值设置为低及以上时,将会看到较多的异常;在将阈值设置为高及以上时,将会看到较少的异常。这种灵敏度是根据 RCF 算法生成的异常分数的标准偏差确定的。默认设置为中等及以上

    • 方向 – 要识别为异常的值在 x 轴或 y 轴上的方向。默认值为 [ALL]。您可以选择以下选项:

      • 设置为高于预期,以将较高的值识别为异常。

      • 设置为低于预期,以将较低的值识别为异常。

      • 设置为 [ALL],以识别所有异常值,包括高值和低值。

    • 最小差值 – 绝对值 – 输入一个自定义值,用作识别异常的绝对阈值。任何高于此值的数量均视为异常。

    • 最小差值 – 百分比 – 输入一个自定义值,用作识别异常的百分比阈值。任何高于此值的数量均视为异常。

    • 排序依据 – 选择要用于对异常进行排序的方法。它们在屏幕上按首选顺序列出。查看以下列表,了解每种方法的描述。

      • 加权异常分数 – 异常分数乘以实际值和预期值之差的绝对值的对数。此分数始终是正数。

      • 异常分数 – 分配给此数据点的实际异常分数。

      • 与预期值的加权差 –(默认)异常分数乘以实际值和预期值之差。

      • 与预期值的差 – 实际值与预期值之间的实际差(实际值-预期值)。

      • 实际值 – 未应用公式的实际值。

    • 类别 – 一个或多个设置可以出现在其他设置的末尾。对于您添加到类别字段井的每个类别字段,都有一个对应的设置。您可以使用类别设置限制屏幕中显示的数据。

按日期显示和隐藏异常

异常的数量图表显示一段时间内检测到的异常值。如果您没有看到此图表,则可以通过选择按日期显示异常来显示此图表。

异常的数量图表

此图表显示了时间序列中最新数据点的异常(异常值)。展开后,它会显示以下组件:

  • 异常 – 屏幕中间显示时间序列中最新数据点的异常。显示一个或多个图形,其中一个图表显示指标随时间的变化。要使用此图形,请选择时间轴上的一个点。当前选择的时间点在图形中突出显示,并包括一个菜单,提供对当前指标的贡献进行分析的选项。您也可以不选择特定点,而是将光标拖到时间轴上,显示该时间点的指标值。

  • 按日期显示异常 – 如果选择按日期显示异常,则另一个图形将显示每个时间点有多少显著异常。可以在此图表中查看每个条的上下文菜单的详细信息。

  • 时间轴调整 – 每个图形在日期下都有一个时间轴调整工具,您可以使用该工具压缩、展开或选择要查看的时间段。

按类别或维度探索异常

探索异常屏幕的主要部分锁定在屏幕的右下角。无论屏幕上有多少其他部分处于打开状态,它都会一直留在此处。如果存在多个异常,则可以向外滚动以突出显示。该图表按颜色范围显示异常,并显示它们在一段时间内的发生位置。

探索异常屏幕。

每个类别或维度都有一个单独的图表,该图表使用字段名称作为图表标题。每个图表都包含以下组件:

  • 配置警报 – 如果您正在从控制面板中探索异常,请选择此按钮订阅警报和贡献分析(如果已配置)。您可以为严重性级别(中、高,等等)设置警报。您可以获得 Higher than expected (高于预期)Lower than expected (低于预期) 或“ALL (全部)”的前五个警报。控制面板读取器可以为自己配置警报。如果您已从分析中打开探索异常页面,则该页面不会显示此按钮。

    注意

    配置警报的功能仅在已发布的控制面板中可用。

  • 状态 – 在异常标头下方,状态标签显示有关上次运行的信息。例如,您可能会看到“2018 年 11 月 17 日的收入异常”。此标签告诉您有多少指标被处理,在多久前处理的。您可以选择该链接来了解详细信息,例如忽略了多少指标。