Alertes dans la version 10 de Grafana - Amazon Managed Grafana

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Alertes dans la version 10 de Grafana

Cette rubrique de documentation est conçue pour les espaces de travail Grafana qui prennent en charge la version 10.x de Grafana.

Pour les espaces de travail Grafana compatibles avec la version 9.x de Grafana, voir. Travailler dans la version 9 de Grafana

Pour les espaces de travail Grafana compatibles avec la version 8.x de Grafana, voir. Travailler dans la version 8 de Grafana

Avec Grafana v10, Amazon Managed Grafana inclut l'accès à un système d'alerte mis à jour, Grafana alerting, qui centralise les informations d'alerte dans une vue unique consultable. L'alerte Grafana a été introduite en tant que fonctionnalité optionnelle dans Grafana v8 et GrafanaLabs a annoncé la suppression des anciennes alertes dans une future version.

Note

Cette documentation couvre les alertes Grafana. Pour plus d'informations sur les anciennes alertes, consultezAlertes classiques sur le tableau.

Grafana Alerting vous permet de vous renseigner sur les problèmes de vos systèmes quelques instants après leur apparition.

Surveillez vos données de mesures entrantes ou vos entrées de journal et configurez votre système d'alerte pour qu'il surveille des événements ou des circonstances spécifiques, puis envoie des notifications lorsque ces éléments sont détectés.

De cette façon, vous éliminez le besoin de surveillance manuelle et vous offrez une première ligne de défense contre les pannes ou les modifications du système susceptibles de se transformer en incidents majeurs.

Grafana Alerting vous permet de créer des requêtes et des expressions à partir de plusieurs sources de données, quel que soit l'endroit où vos données sont stockées, ce qui vous permet de combiner vos données et d'émettre des alertes sur vos indicateurs et journaux de manière nouvelle et unique. Vous pouvez ensuite créer, gérer et agir sur vos alertes à partir d'une vue consolidée unique, et améliorer la capacité de votre équipe à identifier et à résoudre les problèmes rapidement.

Avec les règles d'alerte Mimir et Loki, vous pouvez exécuter des expressions d'alerte au plus près de vos données et à grande échelle, le tout géré par l'interface utilisateur de Grafana que vous connaissez déjà.

Note

Si vous migrez depuis une version antérieure de Grafana, dans laquelle vous utilisiez l'ancienne alerte Grafana, vous trouverez peut-être utile de voir les différences entre l'ancienne alerte et la nouvelle alerte Grafana.

Caractéristiques et avantages clés

Une seule page pour toutes les alertes

Une seule page d'alerte Grafana regroupe en un seul endroit les alertes gérées par Grafana et les alertes résidant dans votre source de données compatible avec Prometheus.

Alertes multidimensionnelles

Les règles d'alerte peuvent créer plusieurs instances d'alerte individuelles par règle d'alerte, appelées alertes multidimensionnelles, ce qui vous donne la puissance et la flexibilité nécessaires pour obtenir une visibilité sur l'ensemble de votre système avec une seule règle d'alerte. Pour ce faire, ajoutez des étiquettes à votre requête afin de spécifier le composant surveillé et de générer plusieurs instances d'alerte pour une seule règle d'alerte. Par exemple, si vous souhaitez surveiller chaque serveur d'un cluster, une alerte multidimensionnelle alertera sur chaque processeur, tandis qu'une alerte standard alertera sur l'ensemble du serveur.

Alertes d'itinéraire

Acheminez chaque instance d'alerte vers un point de contact spécifique en fonction des étiquettes que vous définissez. Les politiques de notification sont un ensemble de règles indiquant où, quand et comment les alertes sont acheminées vers les points de contact.

Alertes de silence

Les silences empêchent la création de notifications et ne durent que pendant une période spécifiée. Les silences vous permettent de ne plus recevoir de notifications persistantes provenant d'une ou de plusieurs règles d'alerte. Vous pouvez également suspendre partiellement une alerte en fonction de certains critères. Les silences disposent de leur propre section dédiée pour une meilleure organisation et une meilleure visibilité, afin que vous puissiez analyser les règles relatives aux alertes suspendues sans encombrer la vue principale des alertes.

Horaire du mode muet

Un temps de sourdine est un intervalle de temps récurrent pendant lequel aucune nouvelle notification relative à une politique n'est générée ou envoyée. Utilisez-les pour empêcher les alertes de se déclencher pendant une période spécifique et récurrente, par exemple une période de maintenance régulière.

À l'instar des silences, le temps de mise en sourdine n'empêche pas l'évaluation des règles d'alerte, ni l'affichage des instances d'alerte dans l'interface utilisateur. Ils empêchent uniquement la création de notifications.

Concevez votre système d'alerte

Il est difficile de surveiller des systèmes informatiques complexes et de déterminer si tout fonctionne correctement. La mise en place d'un système de gestion des alertes efficace est donc essentielle pour vous informer en cas de problème avant que cela n'ait un impact sur les résultats de votre entreprise.

La conception et la configuration d'une configuration de gestion des alertes qui fonctionne prennent du temps.

Voici quelques conseils pour créer une configuration de gestion des alertes efficace pour votre entreprise :

Quels sont les indicateurs clés de votre entreprise que vous souhaitez surveiller et sur lesquels vous souhaitez émettre des alertes ?

  • Trouvez les événements qu'il est important de connaître et qui ne sont pas anodins ou fréquents au point que les destinataires les ignorent.

  • Les alertes ne doivent être créées que pour les grands événements nécessitant une attention ou une intervention immédiate.

  • Privilégiez la qualité à la quantité.

Quel type d'alerte souhaitez-vous utiliser ?

  • Choisissez entre les alertes gérées par Grafana ou les alertes gérées par Grafana Mimir ou Loki, ou les deux.

Comment souhaitez-vous organiser vos alertes et notifications ?

  • Soyez sélectif quant aux personnes que vous configurez pour recevoir les alertes. Envisagez de les envoyer à la personne qui vous appelle ou à une chaîne Slack spécifique.

  • Automatisez autant que possible en utilisant l'API d'alerte ou les alertes sous forme de code (Terraform).

Comment réduire la fatigue liée aux alertes ?

  • Évitez les alertes bruyantes et inutiles en utilisant des silences, des temporisations muettes ou en interrompant l'évaluation des règles d'alerte.

  • Ajustez en permanence vos règles d'alerte pour vérifier leur efficacité. Supprimez les règles d'alerte pour éviter les doublons ou les alertes inefficaces.

  • Réfléchissez bien aux niveaux de priorité et de gravité.

  • Passez en revue en permanence vos seuils et vos règles d'évaluation.

Limites des alertes Grafana

  • Lors de l'agrégation de règles provenant d'autres systèmes, le système d'alerte Grafana peut récupérer les règles de toutes les sources de données Amazon Managed Service pour Prometheus, Prometheus, Loki et Alertmanager disponibles. Il se peut qu'il ne soit pas en mesure d'extraire les règles d'autres sources de données prises en charge.

  • Les règles d'alerte définies dans Grafana, plutôt que dans Prometheus, envoient plusieurs notifications à votre point de contact. Les alertes définies dans d'autres sources de données et agrégées ou affichées dans Grafana ne le sont pas. Il est recommandé d'activer Grafana Alerting lorsque vous utilisez des alertes définies dans des sources de données compatibles avec Prometheus.