Utilisation des politiques de notification - Amazon Managed Grafana

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation des politiques de notification

Cette rubrique de documentation est conçue pour les espaces de travail Grafana qui prennent en charge la version 8.x de Grafana.

Pour les espaces de travail Grafana compatibles avec la version 10.x de Grafana, voir. Travailler dans la version 10 de Grafana

Pour les espaces de travail Grafana compatibles avec la version 9.x de Grafana, voir. Travailler dans la version 9 de Grafana

Les politiques de notification déterminent la manière dont les alertes sont acheminées vers les points de contact. Les politiques ont une structure arborescente, dans laquelle chaque politique peut comporter une ou plusieurs politiques relatives aux enfants. Chaque politique, à l'exception de la stratégie racine, peut également correspondre à des étiquettes d'alerte spécifiques. Chaque alerte est évaluée par la politique racine, puis par chaque politique enfant. Si vous activez l'Continue matching subsequent sibling nodesoption pour une politique spécifique, l'évaluation se poursuit même après une ou plusieurs correspondances. Les paramètres de configuration et les informations du point de contact d'une politique parent régissent le comportement d'une alerte qui ne correspond à aucune des politiques enfant. Une politique racine régit toute alerte qui ne correspond pas à une politique spécifique.

Note

Vous pouvez créer et modifier des politiques de notification pour les alertes gérées par Grafana. Les politiques de notification pour les alertes Alertmanager sont en lecture seule.

Notifications de regroupement

Le regroupement permet de classer les notifications d'alerte de nature similaire dans un entonnoir unique. Cela vous permet de contrôler les notifications d'alerte lors de pannes importantes lorsque de nombreuses parties d'un système tombent en panne simultanément, ce qui entraîne le déclenchement simultané d'un grand nombre d'alertes.

Exemple de regroupement

Supposons que 100 services soient connectés à une base de données dans différents environnements. Ces services sont différenciés par le labelenv=environmentname. Une règle d'alerte est en place pour vérifier si vos services peuvent accéder à la base de données. La règle d'alerte crée des alertes nomméesalertname=DatabaseUnreachable.

En cas de partition réseau empêchant la moitié de vos services d'accéder à la base de données, 50 alertes différentes sont déclenchées. Dans ce cas, vous souhaitez recevoir une notification d'une seule page (au lieu de 50) contenant la liste des environnements concernés.

Vous pouvez configurer le regroupement de manière à ce qu'il soit group_by: [alertname] (sans utiliser l'envétiquette, qui est différente pour chaque service). Une fois cette configuration en place, Grafana envoie une seule notification compacte répertoriant tous les environnements concernés par cette règle d'alerte.

Groupes spéciaux

Grafana compte deux groupes spéciaux. Le groupe par défaut group_by: null regroupe toutes les alertes en un seul groupe. Vous pouvez également utiliser une étiquette spéciale nommée ... pour regrouper les alertes par toutes les étiquettes, désactiver efficacement le regroupement et envoyer chaque alerte dans son propre groupe.

Utilisation des notifications

Les procédures suivantes vous montrent comment créer et gérer des politiques de notification.

Pour modifier la politique de notification root
  1. Depuis votre console Grafana, dans le menu Grafana, choisissez l'icône d'alerte (cloche) pour ouvrir la page d'alerte.

  2. Choisissez Politiques de notification.

  3. Dans le menu déroulant Alertmanager, sélectionnez le Alertmanager que vous souhaitez modifier.

  4. Dans la section Politique racine, choisissez l'icône Modifier (stylo).

  5. Dans Point de contact par défaut, mettez à jour le point de contact auquel les notifications doivent être envoyées pour les règles lorsque les règles d'alerte ne correspondent à aucune politique spécifique.

  6. Dans Regrouper par, choisissez les libellés (ou les groupes spéciaux) selon lesquels regrouper les alertes.

  7. Dans Options de chronométrage, sélectionnez l'une des options suivantes.

    • Patience de groupe : temps d'attente nécessaire pour mettre en mémoire tampon les alertes d'un même groupe avant d'envoyer une notification initiale. Le durée par défaut est 30 secondes.

    • Intervalle de groupe : intervalle de temps minimum entre deux notifications pour un groupe. La valeur par défaut est de 5 minutes.

    • Intervalle de répétition : intervalle de temps minimal avant le renvoi d'une notification si aucune nouvelle alerte n'a été ajoutée au groupe. La valeur par défaut est de 4 heures.

  8. Choisissez Save pour enregistrer les changements.

Pour ajouter une nouvelle politique spécifique de haut niveau
  1. Depuis votre console Grafana, dans le menu Grafana, choisissez l'icône d'alerte (cloche) pour ouvrir la page d'alerte.

  2. Choisissez Politiques de notification.

  3. Dans le menu déroulant Alertmanager, sélectionnez le Alertmanager que vous souhaitez modifier.

  4. Dans la section Routage spécifique, choisissez Nouvelle politique spécifique.

  5. Dans la section Étiquettes correspondantes, ajoutez une ou plusieurs étiquettes d'alerte correspondantes. Vous trouverez plus d'informations sur la correspondance des étiquettes plus loin dans cette rubrique.

  6. Dans Point de contact, ajoutez le point de contact auquel envoyer des notifications si l'alerte correspond à cette politique spécifique. Les politiques imbriquées remplacent ce point de contact.

  7. Sélectionnez éventuellement Remplacer le regroupement pour spécifier un regroupement différent de la politique racine.

  8. Sélectionnez éventuellement Annuler les horaires généraux pour annuler les options de synchronisation de la politique de notification de groupe.

  9. Choisissez Enregistrer la politique pour enregistrer les changements.

Pour ajouter une politique imbriquée
  1. Développez la stratégie spécifique sous laquelle vous souhaitez créer une politique imbriquée.

  2. Choisissez Ajouter une politique imbriquée, puis ajoutez les détails (comme lors de l'ajout d'une politique spécifique de haut niveau).

  3. Choisissez Enregistrer la politique pour enregistrer les changements.

Pour modifier une politique spécifique
  1. Sur la page Alertes, choisissez Politiques de notification pour ouvrir la page répertoriant les politiques existantes.

  2. Sélectionnez la politique que vous souhaitez modifier, puis cliquez sur l'icône Modifier (stylo).

  3. Apportez des modifications (comme lors de l'ajout d'une politique spécifique de haut niveau).

  4. Choisissez Enregistrer la stratégie.

Comment fonctionne la correspondance des étiquettes

Une politique correspond à une alerte si les libellés de l'alerte correspondent à tous les libellés correspondants spécifiés dans la stratégie.

  • Étiquette : nom de l'étiquette à associer. Il doit correspondre exactement au nom de l'étiquette de l'alerte.

  • Opérateur : opérateur utilisé pour comparer la valeur de l'étiquette avec la valeur d'étiquette correspondante. Les opérateurs disponibles sont les suivants :

    • =Sélectionnez les libellés dont la valeur correspond exactement à la chaîne fournie.

    • !=Sélectionnez les libellés dont la valeur ne correspond pas à la chaîne fournie.

    • =~Sélectionnez les étiquettes dont la valeur correspond à la valeur interprétée par regex de la chaîne fournie (la chaîne fournie est interprétée comme une expression régulière).

    • !=Sélectionnez les libellés qui ne correspondent pas à l'expression régulière fournie.

  • Valeur : valeur à laquelle doit correspondre la valeur de l'étiquette. Il peut correspondre sous forme de chaîne ou d'expression régulière, selon l'opérateur choisi.

Horaire du mode muet

Un temps de sourdine est un intervalle de temps récurrent pendant lequel aucune nouvelle notification relative à une politique n'est générée ou envoyée. Utilisez-les pour empêcher les alertes de se déclencher pendant une période spécifique et récurrente, par exemple une période de maintenance régulière.

À l'instar des silences, le temps de mise en sourdine n'empêche pas l'évaluation des règles d'alerte, ni l'affichage des instances d'alerte dans l'interface utilisateur. Ils empêchent uniquement la création de notifications.

Vous pouvez configurer les durées de sourdine gérées par Grafana ainsi que les durées de sourdine pour une source de données Alertmanager externe.

Timings muets comparés aux silences

Le tableau suivant met en évidence les différences entre les temps de mise en sourdine et les silences.

Synchronisation en mode muet Silence

Utilise des définitions d'intervalles de temps qui peuvent se reproduire

A une heure de début et de fin fixes

Est créé puis ajouté aux politiques de notification

Utilise des étiquettes pour établir une correspondance avec une alerte afin de déterminer s'il convient de désactiver ou non

Pour créer un chronométrage muet
  1. Depuis votre console Grafana, dans le menu Grafana, choisissez l'icône d'alerte (cloche) pour ouvrir la page d'alerte.

  2. Choisissez Politiques de notification.

  3. Dans le menu déroulant Alertmanager, sélectionnez le Alertmanager que vous souhaitez modifier.

  4. Dans la section Durée de mise en sourdine, cliquez sur le bouton Ajouter une temporisation de mise en sourdine.

  5. Choisissez l'intervalle de temps auquel vous souhaitez appliquer la temporisation du mode muet.

  6. Choisissez Soumettre pour créer la temporisation du mode muet.

Pour ajouter une temporisation muette à une politique de notification
  1. Sélectionnez la politique de notification à laquelle vous souhaitez ajouter le temps de sourdine, puis cliquez sur le bouton Modifier.

  2. Dans le menu déroulant Durée de mise en sourdine, sélectionnez la durée de mise en sourdine que vous souhaitez ajouter à la politique.

    Cliquez sur le bouton Enregistrer la politique.

Intervalles de temps

Un intervalle de temps est la définition d'une plage de temps. Si une alerte est déclenchée pendant cet intervalle, elle est supprimée. Les plages sont prises en charge à l'aide de : (par exemple,monday:thursday). Une temporisation muette peut contenir plusieurs intervalles de temps. Un intervalle de temps se compose de plusieurs champs (détails dans la liste suivante), qui doivent tous correspondre pour supprimer les alertes. Par exemple, si vous spécifiez des jours de la semaine monday:friday et une plage horaire comprise entre 8 h et 9 h, les alertes sont supprimées du 8 au 9, du lundi au vendredi, mais pas, par exemple, de 8 h à 9 h le samedi.

  • Plage horaire : heure à laquelle les notifications doivent être supprimées. Composé de deux sous-champs, Heure de début et Heure de fin. Un exemple de temps est14:30. L'heure est exprimée en notation de 24 heures, en UTC.

  • Jours de la semaine — Les jours de la semaine. Il peut s'agir d'un jour uniquemonday, tel qu'une plagemonday:friday, ou d'une liste de jours séparés par des virgules, telle que. monday, tuesday, wednesday

  • Mois — Les mois à sélectionner. Vous pouvez spécifier les mois avec des désignations numériques ou avec le nom complet du mois, par exemple, 1 ou les january deux spécifier janvier. Vous pouvez spécifier un mois unique, une plage de mois ou une liste de mois séparés par des virgules.

  • Jours du mois : dates comprises dans un mois. Les valeurs peuvent être comprises entre 1 -31. Les valeurs négatives indiquent les jours du mois dans l'ordre inverse, ce -1 qui représente le dernier jour du mois. Les jours du mois peuvent être spécifiés sous la forme d'un jour unique, d'une plage de jours ou d'une liste de jours séparés par des virgules.