将经典仪表板警报迁移到 Grafana 警报 - Amazon Managed Grafana

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将经典仪表板警报迁移到 Grafana 警报

本文档主题专为支持 Grafana 版本 10.x 的 Grafana 工作空间而设计。

有关支持 Grafana 9.x 版本的 Grafana 工作空间,请参阅。在 Grafana 版本 9 中工作

有关支持 Grafana 8.x 版本的 Grafana 工作空间,请参阅。在 Grafana 版本 8 中工作

选择不使用 Grafana 警报的工作区使用。经典仪表板提醒要切换到新的 Grafana 警报,您必须选择启用该功能。要详细了解经典控制面板警报和 Grafana 警报之间的区别,请参阅。Grafana 警报与传统仪表板警报的对比

当您使用经典控制面板警报时,Amazon Managed Grafana 会向您显示 Grafana 警报的预览,您可以在其中查看和修改升级后的提醒,然后再完成升级。

注意

使用 Grafana 警报时,在 Grafana(而非 Prometheus)中定义的警报规则会向您的联系人发送多条通知。如果您使用的是原生 Grafana 警报,我们建议您继续使用经典控制面板警报,不要启用新的 Grafana 警报功能。如果您想查看 Prometheus 数据源中定义的警报,那么我们建议您启用 Grafana Alerting,它只会针对在 Prometheus Alertmanager 中创建的警报发送一条通知。

预览 Grafana 警报

迁移之前,您可以在 Grafana 警报中预览警报。在预览中,您可以更改将更改迁移的警报。

预览您的 Grafana 迁移提醒
  1. 登录您的 Grafana 工作空间。

  2. 从左侧菜单中选择 “警报(旧版)” 以查看您当前的警报。

  3. 从左侧菜单中,选择警报升级,在 Grafana 警报中查看您的警报。

    从这个视图中,您可以看到迁移后的警报会是什么样子。

注意

从这个角度来看,您还可以进行会影响迁移的更改。要撤消所做的任何更改,请选择升级页面右上角的 “重置升级”。

当您准备好升级警报时,请参阅下一节。

迁移到 Grafana 警报系统

您可以使用、或亚马逊托管 Grafana API 将您的亚马逊托管 Grafana 实例配置为使用 Grafana 警报。 AWS Management Console AWS CLI有关如何配置亚马逊托管 Grafana(包括开启或关闭 Grafana 提醒)的详细信息,请参阅。配置亚马逊托管 Grafana 工作空间

开启 Grafana 警报后,现有的经典控制面板警报会以与 Grafana 警报兼容的格式进行迁移。在 Grafana 实例的警报页面中,您可以查看迁移的警报以及新的警报。借助 Grafana 警报,Grafana 管理的警报规则在匹配时会发送多条通知,而不是单个警报。

对经典仪表板警报和 Grafana 警报的读写权限受存储这些警报的文件夹的权限控制。在迁移过程中,经典仪表板警报权限与新规则权限匹配,如下所示:

  • 如果原始警报的仪表板具有权限,则迁移会创建一个以此格式命名的文件夹,Migrated {"dashboardUid": "UID", "panelId": 1, "alertId": 1}以匹配原始仪表板的权限(包括从该文件夹继承的权限)。

  • 如果没有仪表板权限并且仪表板位于某个文件夹下,则该规则将链接到该文件夹并继承其权限。

  • 如果没有仪表板权限并且仪表板位于 “常规” 文件夹下,则该规则将链接到 “常规警报” 文件夹,并且该规则将继承默认权限。

注意

由于 Grafana 警报NoData中没有Keep Last State选项,因此在经典规则迁移期间NoData会出现此选项。Error处理选项Keep Last State已迁移到新选项Error。为了与这两种情况下的行为相匹配Keep Last State,在迁移期间,Amazon Managed Grafana 会自动为每条警报规则创建静音,持续时间为一年。

通知渠道将迁移到带有相应路由和接收器的警报管理器配置。默认通知渠道将作为联系点添加到默认路径中。与任何仪表板警报都没有关联的通知渠道会转到autogen-unlinked-channel-recv路线。

限制

  • Grafana 警报系统可以从所有可用的 Prometheus、Loki 和 Alertmanager 数据源中检索规则。它可能无法从其他支持的数据源获取警报规则。

  • 在 Grafana 警报和经典仪表板警报之间来回迁移可能会导致一个系统支持的功能的数据丢失,而另一个系统却不支持。

    注意

    如果您迁移回经典控制面板警报,则在启用 Grafana 警报时对警报配置所做的所有更改都将丢失,包括创建的任何新警报规则。

Grafana 警报与传统仪表板警报的对比

Grafana 8 中引入的 Grafana 警报与传统仪表板警报相比有多项增强。

多维警报

现在,您可以创建警报,通过一条警报规则为您提供全系统的可见性。根据单个警报规则生成多个警报实例。例如,您可以创建一条规则来监控单个主机上多个装载点的磁盘使用情况。评估引擎从单个查询中返回多个时间序列,每个时间序列由其标签集标识。

在仪表板之外创建警报

与传统的仪表板警报不同,Grafana 警报允许您创建查询和表达式,以独特的方式组合来自多个来源的数据。您仍然可以使用 ID 将仪表板和面板与警报规则关联起来,并快速对所观察的系统进行故障排除。

由于统一警报不再与面板查询直接关联,因此它们在通知电子邮件中不包含图像或查询值。您可以使用自定义的通知模板来查看查询值。

创建 Loki 和 Grafana Mimir 警报规则

在 Grafana Alerting 中,你可以使用与 Grafana 托管警报相同的用户界面和 API 来管理 Loki 和 Grafana Mimir 警报规则。

查看和搜索来自 Prometheus 兼容数据源的警报

与 Prometheus 兼容的数据源的警报现在列在 Grafana 警报部分下。您可以跨多个数据源搜索标签,以快速找到相关的警报。

警报状态 NoData 和错误的特殊警报

Grafana Alerting 引入了警报状态的新概念。当对警报规则的评估产生状态 NoData 或错误时,Grafana Alerting 将生成带有以下标签的特殊警报:

  • alertname使用值 DatasourceNoData 或 DatasourceError 取决于州。

  • rulename特殊警报所属的警报规则的名称。

  • datasource_uid将具有导致该状态的数据源的 UID。

  • 原始警报规则的所有标签和注释

您可以像处理常规警报一样处理这些警报,方法是添加静音、前往联系点的路线等。

注意

如果规则使用多个数据源,而一个或多个数据源未返回任何数据,则将为导致警报状态的每个数据源创建特殊警报。