Types de règles d'alerte Concepts clés et fonctionnalités

Exploration des alertes

Cette rubrique de documentation est conçue pour les espaces de travail Grafana compatibles avec la version 9.x de Grafana.

Pour les espaces de travail Grafana compatibles avec la version 10.x de Grafana, voir. Travailler dans la version 10 de Grafana

Pour les espaces de travail Grafana compatibles avec la version 8.x de Grafana, voir. Travailler dans la version 8 de Grafana

Que vous commenciez ou étendiez votre implémentation de Grafana Alerting, découvrez les concepts clés et les fonctionnalités disponibles qui vous aident à créer, gérer et agir sur vos alertes et à améliorer la capacité de votre équipe à résoudre rapidement les problèmes.

Tout d'abord, examinons les différents types de règles d'alerte proposés par Grafana Alerting.

Types de règles d'alerte

Règles gérées par Grafana

Les règles gérées par Grafana constituent le type de règle d'alerte le plus flexible. Ils vous permettent de créer des alertes qui peuvent agir sur les données provenant de l'une de nos sources de données prises en charge. Outre la prise en charge de plusieurs sources de données, vous pouvez également ajouter des expressions pour transformer vos données et définir des conditions d'alerte. Il s'agit du seul type de règle qui permet d'émettre des alertes à partir de plusieurs sources de données dans une seule définition de règle.

Règles de Mimir et Loki

Pour créer des alertes Mimir ou Loki, vous devez disposer d'une source de données Prometheus ou Loki compatible. Vous pouvez vérifier si votre source de données prend en charge la création de règles via Grafana en testant la source de données et en observant si l'API des règles est prise en charge.

Règles d'enregistrement

Les règles d'enregistrement ne sont disponibles que pour les sources de données Prometheus ou Loki compatibles. Une règle d'enregistrement permet de précalculer des expressions fréquemment utilisées ou coûteuses en termes de calcul et d'enregistrer leur résultat sous la forme d'un nouvel ensemble de séries temporelles. Cela est utile si vous souhaitez exécuter des alertes sur des données agrégées ou si vous disposez de tableaux de bord qui interrogent à plusieurs reprises des expressions coûteuses en termes de calcul.

Concepts clés et fonctionnalités

Le tableau suivant inclut une liste des concepts clés, des fonctionnalités et de leurs définitions, conçus pour vous aider à tirer le meilleur parti de Grafana Alerting.

Concept ou fonctionnalité clé	Définition
Sources de données pour les alertes	Sélectionnez les sources de données que vous souhaitez interroger et visualisez les métriques, les journaux et les traces à partir desquelles vous souhaitez effectuer des recherches.
Provisionnement pour alertes	Gérez vos ressources d'alerte et approvisionnez-les dans votre système Grafana à l'aide du provisionnement de fichiers ou de Terraform.
Gestionnaire d'alertes	Gère le routage et le regroupement des instances d'alerte.
Règle d'alerte	Ensemble de critères d'évaluation indiquant à quel moment une règle d'alerte doit être déclenchée. Une règle d'alerte comprend une ou plusieurs requêtes et expressions, une condition, la fréquence d'évaluation et la durée pendant laquelle la condition est remplie. Une règle d'alerte peut produire plusieurs instances d'alerte.
Instance d'alertes	Une instance d'alerte est une instance d'une règle d'alerte. Une règle d'alerte unidimensionnelle possède une instance d'alerte. Une règle d'alerte multidimensionnelle comporte une ou plusieurs instances d'alerte. Une seule règle d'alerte qui correspond à plusieurs résultats, tels que le nombre de processeurs par rapport à 10 VMs, est comptée comme plusieurs instances d'alerte (dans ce cas 10). Ce nombre peut varier au fil du temps. Par exemple, une règle d'alerte qui surveille l'utilisation du processeur pour tous les VMs membres d'un système comporte davantage d'instances d'alerte au fur et à mesure qu' VMs elles sont ajoutées. Pour de plus amples informations sur les quotas d'instances d'alerte, veuillez consulter la section (français non). Erreurs de quotas atteints
Groupe d'alertes	L'Alertmanager regroupe les instances d'alerte par défaut en utilisant les étiquettes de la politique de notification racine. Cela permet de contrôler la déduplication et les groupes d'instances d'alerte, qui sont envoyés aux points de contact.
Point de contact	Définissez la manière dont vos contacts sont avertis lorsqu'une règle d'alerte est déclenchée.
Modèle de messages	Créez des modèles personnalisés réutilisables et utilisez-les dans les points de contact.
Politique de notification	Ensemble de règles indiquant où, quand et comment les alertes sont regroupées et acheminées vers les points de contact.
Étiquettes et dispositifs d'appariement	Les étiquettes identifient de manière unique les règles d'alerte. Ils relient les règles d'alerte aux politiques de notification et aux silences, afin de déterminer quelle politique doit les gérer et quelles règles d'alerte doivent être réduites au silence.
Silences	Arrêtez les notifications provenant d'une ou de plusieurs instances d'alerte. La différence entre un temps de silence et un temps de sourdine réside dans le fait qu'un silence ne dure que pendant une période spécifiée, alors qu'un temps de silence est censé être récurrent selon un calendrier. Utilise des analyseurs d'étiquettes pour désactiver les instances d'alerte.
Horaire du mode muet	Spécifiez un intervalle de temps pendant lequel vous ne souhaitez pas que de nouvelles notifications soient générées ou envoyées. Vous pouvez également geler les notifications d'alerte pour des périodes récurrentes, par exemple pendant une période de maintenance. Doit être lié à une politique de notification existante.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Présentation

Sources de données