Gestion et transfert des alertes dans Amazon Managed Service for Prometheus avec le gestionnaire d'alertes - Amazon Managed Service for Prometheus

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Gestion et transfert des alertes dans Amazon Managed Service for Prometheus avec le gestionnaire d'alertes

Lorsque Amazon Managed Service for Prometheus déclenchent des règles d’alerte, le gestionnaire d’alertes gère les alertes envoyées. Il déduplique, regroupe et achemine les alertes vers les récepteurs en aval. Amazon Managed Service for Prometheus prend uniquement en charge Amazon Simple Notification Service en tant que récepteur et peut acheminer des messages vers les rubriques Amazon SNS sur le même compte. Vous pouvez également utiliser le gestionnaire d’alertes pour désactiver ou bloquer des alertes.

Le gestionnaire d’alertes fournit des fonctionnalités similaires à celles du gestionnaire d’alertes dans Prometheus.

Vous pouvez utiliser le fichier de configuration du gestionnaire d’alertes pour les opérations suivantes :

  • Regroupement : le regroupement permet de rassembler des alertes similaires en une seule notification. Cela est particulièrement utile lors de pannes importantes lorsque de nombreux systèmes tombent en panne en même temps et que des centaines d’alertes peuvent se déclencher simultanément. Par exemple, supposons qu’une panne de réseau entraîne la défaillance simultanée de plusieurs nœuds. Si les alertes de ce type sont regroupées, le gestionnaire d’alertes ne vous envoie qu’une seule notification.

    Le regroupement des alertes et le calendrier des notifications groupées sont configurés par une arborescence de routage dans le fichier de configuration du gestionnaire d’alertes. Pour plus d’informations, consultez <route>.

  • Inhibition : supprime les notifications pour certaines alertes si d’autres alertes sont déjà déclenchées. Par exemple, si une alerte indique qu’un cluster est inaccessible, vous pouvez configurer le gestionnaire d’alertes pour masquer toutes les autres alertes concernant ce cluster. Cela permet d’éviter les notifications pour des centaines ou des milliers d’alertes de déclenchement qui ne sont pas liées au problème réel. Pour plus d’informations sur la rédaction des règles d’inhibition, consultez <inhibit_rule>.

  • Silences : masque les alertes pendant une durée spécifiée, par exemple pendant une période de maintenance. Les alertes entrantes sont vérifiées pour déterminer si elles correspondent à tous les critères d’égalité ou d’expression régulière d’un silence actif. Si c’est le cas, aucune notification n’est envoyée pour cette alerte.

    Pour créer un silence, vous devez utiliser l’API PutAlertManagerSilences. Pour plus d’informations, consultez PutAlertManagerSilences.

Modélisation de Prometheus

Prometheus autonome prend en charge la création de modèles à l'aide de fichiers modèles distincts. Les modèles peuvent notamment utiliser des conditions et formater des données.

Dans Amazon Managed Service for Prometheus, vous placez votre modèle dans le même fichier de configuration du gestionnaire d'alertes que celui de votre gestionnaire d'alertes.