Découvrir les alertes - Amazon Managed Grafana

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Découvrir les alertes

Cette rubrique de documentation est conçue pour les espaces de travail Grafana compatibles avec la version 9.x de Grafana.

Pour les espaces de travail Grafana compatibles avec la version 10.x de Grafana, voir. Travailler dans la version 10 de Grafana

Pour les espaces de travail Grafana compatibles avec la version 8.x de Grafana, voir. Travailler dans la version 8 de Grafana

Que vous commenciez ou étendiez votre implémentation de Grafana Alerting, découvrez les concepts clés et les fonctionnalités disponibles qui vous aident à créer, gérer et agir sur vos alertes et à améliorer la capacité de votre équipe à résoudre rapidement les problèmes.

Tout d'abord, examinons les différents types de règles d'alerte proposés par Grafana Alerting.

Types de règles d'alerte

Règles gérées par Grafana

Les règles gérées par Grafana constituent le type de règle d'alerte le plus flexible. Ils vous permettent de créer des alertes qui peuvent agir sur les données provenant de l'une de nos sources de données prises en charge. Outre la prise en charge de plusieurs sources de données, vous pouvez également ajouter des expressions pour transformer vos données et définir des conditions d'alerte. Il s'agit du seul type de règle qui permet d'émettre des alertes à partir de plusieurs sources de données dans une seule définition de règle.

Règles de Mimir et Loki

Pour créer des alertes Mimir ou Loki, vous devez disposer d'une source de données Prometheus ou Loki compatible. Vous pouvez vérifier si votre source de données prend en charge la création de règles via Grafana en testant la source de données et en observant si l'API des règles est prise en charge.

Règles d'enregistrement

Les règles d'enregistrement ne sont disponibles que pour les sources de données Prometheus ou Loki compatibles. Une règle d'enregistrement vous permet de précalculer des expressions fréquemment nécessaires ou coûteuses en termes de calcul et d'enregistrer leur résultat sous la forme d'un nouvel ensemble de séries chronologiques. Cela est utile si vous souhaitez exécuter des alertes sur des données agrégées ou si vous disposez de tableaux de bord qui interrogent à plusieurs reprises des expressions coûteuses en termes de calcul.

Concepts et fonctionnalités clés

Le tableau suivant inclut une liste des concepts clés, des fonctionnalités et de leurs définitions, conçus pour vous aider à tirer le meilleur parti de Grafana Alerting.

Concept ou fonctionnalité clé Définition

Sources de données pour les alertes

Sélectionnez les sources de données que vous souhaitez interroger et visualisez les métriques, les journaux et les traces à partir desquelles vous souhaitez effectuer des recherches.

Provisionnement pour les alertes

Gérez vos ressources d'alerte et approvisionnez-les dans votre système Grafana à l'aide du provisionnement de fichiers ou de Terraform.

Gestionnaire d'alertes

Gère le routage et le regroupement des instances d'alerte.

Règle d'alerte

Ensemble de critères d'évaluation indiquant à quel moment une règle d'alerte doit être déclenchée. Une règle d'alerte comprend une ou plusieurs requêtes et expressions, une condition, la fréquence d'évaluation et la durée pendant laquelle la condition est remplie. Une règle d'alerte peut produire plusieurs instances d'alerte.

Instance d'alerte

Une instance d'alerte est une instance d'une règle d'alerte. Une règle d'alerte unidimensionnelle possède une instance d'alerte. Une règle d'alerte multidimensionnelle comporte une ou plusieurs instances d'alerte. Une seule règle d'alerte qui correspond à plusieurs résultats, tels que le processeur par rapport à 10 machines virtuelles, est comptée comme plusieurs (dans ce cas 10) instances d'alerte. Ce nombre peut varier au fil du temps. Par exemple, une règle d'alerte qui surveille l'utilisation du processeur pour toutes les machines virtuelles d'un système comporte davantage d'instances d'alerte à mesure que des machines virtuelles sont ajoutées. Pour plus d'informations sur les quotas d'instance d'alerte, consultez. Erreurs liées au quota atteint

Groupe d'alertes

L'Alertmanager regroupe les instances d'alerte par défaut en utilisant les étiquettes de la politique de notification racine. Cela contrôle la déduplication et les groupes d'instances d'alerte, qui sont envoyés aux points de contact.

Point de contact

Définissez la manière dont vos contacts sont avertis lorsqu'une règle d'alerte est déclenchée.

Modèle de message

Créez des modèles personnalisés réutilisables et utilisez-les dans les points de contact.

Politique de notification

Ensemble de règles indiquant où, quand et comment les alertes sont regroupées et acheminées vers les points de contact.

Étiquettes et dispositifs d'appariement

Les étiquettes identifient de manière unique les règles d'alerte. Ils relient les règles d'alerte aux politiques de notification et aux silences, afin de déterminer quelle politique doit les gérer et quelles règles d'alerte doivent être réduites au silence.

Silences

Arrêtez les notifications provenant d'une ou de plusieurs instances d'alerte. La différence entre un temps de silence et un temps de sourdine est qu'un silence ne dure que pendant une période spécifiée, alors qu'un temps de silence est censé être récurrent selon un calendrier. Utilise des analyseurs d'étiquettes pour désactiver les instances d'alerte.

Horaire du mode muet

Spécifiez un intervalle de temps pendant lequel vous ne souhaitez pas que de nouvelles notifications soient générées ou envoyées. Vous pouvez également geler les notifications d'alerte pour des périodes récurrentes, par exemple pendant une période de maintenance. Doit être lié à une politique de notification existante.