Gestión y reenvío de alertas en Amazon Managed Service para Prometheus con gestor de alertas - Servicio administrado por Amazon para Prometheus

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Gestión y reenvío de alertas en Amazon Managed Service para Prometheus con gestor de alertas

Cuando se activan las reglas de alerta que ejecuta Amazon Managed Service para Prometheus, el administrador de alertas administra las alertas que se envían. Desduplica, agrupa y enruta las alertas a los receptores posteriores. Amazon Managed Service para Prometheus solo admite Amazon Simple Notification Service como receptor y puede enrutar mensajes a temas de Amazon SNS de la misma cuenta. También puede utilizar el administrador de alertas para silenciar e inhibir las alertas.

El administrador de alertas proporciona una funcionalidad similar al administrador de alertas de Prometheus.

Puede utilizar el archivo de configuración del administrador de alertas para lo siguiente:

  • Agrupación: la agrupación recopila alertas similares en una sola notificación. Esto resulta especialmente útil durante las interrupciones más largas, cuando muchos sistemas fallan a la vez y es posible que se activen cientos de alertas de forma simultánea. Por ejemplo, supongamos que un fallo en la red provoca que varios nodos fallen al mismo tiempo. Si estos tipos de alertas están agrupados, el administrador de alertas le enviará una única notificación.

    La agrupación de alertas y la planificación de las notificaciones agrupadas se configuran mediante un árbol de enrutamiento en el archivo de configuración del administrador de alertas. Para obtener más información, consulte <route>.

  • Inhibición: la inhibición suprime las notificaciones de determinadas alertas si ya se han activado otras. Por ejemplo, si se activa una alerta sobre un clúster inalcanzable, puede configurar el administrador de alertas para silenciar todas las demás alertas relacionadas con dicho clúster. Esto evita que se envíen cientos o miles de alertas que no estén relacionadas con el problema real. Para obtener más información sobre cómo escribir reglas de inhibición, consulte <inhibit_rule>.

  • Silencios: silencia las alertas durante un tiempo específico; por ejemplo, durante un periodo de mantenimiento. Se comprueba si las alertas entrantes coinciden con todos los parámetros de igualdad o con expresiones regulares de un silencio activo. En caso afirmativo, no se envía ninguna notificación para dicha alerta.

    Para crear un silencio, se utiliza la API PutAlertManagerSilences. Para obtener más información, consulte PutAlertManagerSilences.

Plantillas de Prometheus

Prometheus independiente admite la creación de plantillas mediante archivos de plantilla independientes. Las plantillas pueden usar condicionales y dar formato a los datos, entre otras cosas.

En Amazon Managed Service for Prometheus, coloca las plantillas en el mismo archivo de configuración del administrador de alertas que la configuración del administrador de alertas.