Gerenciamento e encaminhamento de alertas no Amazon Managed Service para Prometheus com o gerenciador de alertas - Amazon Managed Service para Prometheus

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Gerenciamento e encaminhamento de alertas no Amazon Managed Service para Prometheus com o gerenciador de alertas

Quando as regras de alerta executáveis pelo Amazon Managed Service for Prometheus são acionadas, o gerenciador de alertas controla os alertas enviados. Ele desduplica, agrupa e encaminha os alertas para os receptores posteriores. O Amazon Managed Service for Prometheus oferece suporte somente ao Amazon Simple Notification Service como receptor e pode rotear mensagens para tópicos do Amazon SNS na mesma conta. Você também pode usar o gerenciador de alertas para silenciar e inibir os alertas.

O gerenciador de alertas fornece funcionalidade semelhante ao Alertmanager no Prometheus.

Use o arquivo de configuração do gerenciador de alertas nos seguintes casos:

  • Agrupamento — O agrupamento coleta alertas similares em uma única notificação. Isso é especialmente útil durante interrupções maiores, quando muitos sistemas falham ao mesmo tempo e centenas de alertas podem ser acionados simultaneamente. Por exemplo, suponha que uma falha na rede cause uma falha em muitos de seus nós simultaneamente. Se esses tipos de alertas estiverem agrupados, o gerenciador de alertas enviará uma única notificação.

    O agrupamento de alertas e o período das notificações agrupadas são configurados por uma árvore de roteamento no arquivo de configuração do gerenciador de alertas. Para obter mais informações, consulte <route>.

  • Inibição — A inibição suprime as notificações de determinados alertas quando outros alertas já estiverem acionados. Por exemplo, se tiver um alerta acionado sobre um cluster inacessível, você pode configurar o gerenciador de alertas para silenciar todos os outros alertas relacionados a esse cluster. Isso evita notificações de centenas ou milhares de alertas de acionamento não relacionados ao problema real. Para obter mais informações sobre como escrever regras de inibição, consulte <inhibit_rule>.

  • Silencia — Silencia alertas sem som por um período específico, por exemplo, durante uma janela de manutenção. Os alertas recebidos são verificados para conferir se têm todas as correspondências de igualdade ou expressão regular de um silêncio ativo. Se forem correspondentes, nenhuma notificação será enviada de tal alerta.

    Para criar um silêncio, você usa a API PutAlertManagerSilences. Para ter mais informações, consulte PutAlertManagerSilences.

Modelagem de Prometheus

O Prometheus autônomo oferece suporte à modelagem, usando arquivos de modelo separados. Os modelos podem usar condicionais e formatar dados, entre outras coisas.

No Amazon Managed Service for Prometheus, você coloca sua modelagem no mesmo arquivo de configuração do gerenciador de alertas da configuração do gerenciador de alertas.