Criação de alertas - Amazon Managed Grafana

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criação de alertas

Este tópico de documentação foi desenvolvido para espaços de trabalho do Grafana que oferecem suporte à versão 8.x do Grafana.

Para espaços de trabalho do Grafana que suportam a versão 9.x do Grafana, consulte. Trabalhando na versão 9 do Grafana

Ao usar os alertas Amazon Managed Grafana, você pode anexar regras aos painéis do seu painel. Quando você salva o painel, o Amazon Managed Grafana extrai as regras de alerta em um armazenamento de regras de alerta separado e as programa para avaliação.

Na guia Alerta do painel gráfico, você pode configurar com que frequência a regra de alerta deve ser avaliada e as condições que devem ser atendidas para que o alerta mude de estado e inicie suas notificações.

Atualmente, somente o painel gráfico suporta regras de alerta.

Adicionar ou editar uma regra de alerta

  1. Navegue até o painel em que adicione ou edite uma regra de alerta, escolha o título e escolha Editar.

  2. Na guia Alerta, escolha Criar alerta. Se já existir um alerta para esse painel, você poderá editar os campos na guia Alerta.

  3. Preencha os campos. Para ter mais informações, consulte Campos de regras de alerta.

  4. Quando terminar de escrever sua regra, escolha Salvar no canto superior direito para salvar a regra de alerta e o painel.

  5. (Opcional, mas recomendado) Para garantir que a regra retorne os resultados esperados, escolha Testar regra.

Excluindo uma regra de alerta

Para excluir um alerta, vá até a parte inferior do alerta e escolha Excluir.

Campos de regras de alerta

Esta seção descreve os campos que você preenche para criar um alerta.

Regra

  • Nome — Insira um nome descritivo. O nome será exibido na lista de regras de alerta.

  • Avalie cada — especifique com que frequência o programador deve avaliar a regra de alerta. Isso é conhecido como intervalo de avaliação.

  • Por — Especifique por quanto tempo a consulta deve violar os limites configurados antes que a notificação de alerta seja acionada.

Atenção

Não use For com a If no data or all values are null configuração definida comoNo Data. O acionamento do No Data será acionado instantaneamente e não será levado For em consideração. Isso também pode fazer com que uma notificação de OK não seja enviada se o alerta sair deNo Data -> Pending -> OK.

Se uma regra de alerta estiver configurada For e a consulta violar o limite configurado, ela passará primeiro de OK para. Pending Indo de OK paraPending, o Amazon Managed Grafana não envia nenhuma notificação. Quando a regra de alerta estiver sendo acionada por mais do que a For duração, ela mudará para Alerting e enviará notificações de alerta.

Normalmente, recomendamos usar essa configuração porque geralmente é pior receber um falso positivo do que esperar alguns minutos antes do início da notificação de alerta. Olhando para o Alert list ouAlert list panels, você poderá ver os alertas que estão no estado pendente.

Condições

Atualmente, o único tipo de condição existente é uma Query condição que permite especificar uma carta de consulta, um intervalo de tempo e uma função de agregação.

Exemplo de condição de consulta

avg() OF query(A, 15m, now) IS BELOW 14
  • avg()Controla como os valores de cada série devem ser reduzidos a um valor que possa ser comparado com o limite. Escolha a função para alterá-la para outra função de agregação.

  • query(A, 15m, now)A carta define qual consulta executar na guia Métricas. Os dois segundos parâmetros definem o intervalo de tempo: 15m, now significa 15 minutos atrás até agora. Você também pode usar 10m, now-2m para definir um intervalo de tempo que será de 10 minutos atrás a 2 minutos atrás. Isso é útil se você quiser ignorar os últimos 2 minutos de dados.

  • IS BELOW 14Define o tipo de limite e o valor do limite. Você pode IS BELOW optar por alterar o tipo de limite.

A consulta usada em uma regra de alerta não pode conter nenhuma variável de modelo. Atualmente, oferecemos suporte somente a OR operadores AND e operadoras entre condições, e elas são executadas em série. Por exemplo, temos três condições na seguinte ordem: Condição:a (avalia como: VERDADEIRO) OU CONDIÇÃO:B (avalia como: FALSO) E CONDIÇÃO:C (avalia como: VERDADEIRO), então o resultado será calculado como (VERDADEIRO OU FALSO) E VERDADEIRO) = VERDADEIRO.

Várias séries

Se uma consulta retornar várias séries, a função de agregação e a verificação de limite serão avaliadas para cada série. Atualmente, o Amazon Managed Grafana não rastreia o estado da regra de alerta por série. As implicações disso são detalhadas no cenário a seguir.

  • Uma condição de alerta com consulta que retorna duas séries: servidor1 e servidor2.

  • A série server1 faz com que a regra de alerta seja acionada e mude para o estado. Alerting

  • As notificações são enviadas com a mensagem: pico de carga (servidor1)

  • Em uma avaliação subsequente da mesma regra de alerta, a série server2 também faz com que a regra de alerta seja acionada.

  • Nenhuma nova notificação é enviada porque a regra de alerta já está em vigorAlerting.

Como você pode ver no cenário anterior, se a regra já estiver em vigorAlerting, a Grafana não enviará notificações quando outras séries fizerem com que o alerta seja acionado.

nota

Você pode configurar lembretes a serem enviados para alertas acionados. Isso enviará notificações adicionais quando um alerta continuar sendo disparado. Se outras séries (como server2 no exemplo anterior) também fizerem com que a regra de alerta seja acionada, elas serão incluídas na notificação de lembrete. Dependendo do canal de notificação que você está usando, talvez você possa aproveitar esse recurso para identificar séries novas ou existentes que estão causando o disparo de alertas.

Sem dados e tratamento de erros

A tabela a seguir contém condições para controlar como o mecanismo de avaliação de regras lida com consultas que não retornam dados ou apenas valores nulos.

Sem opção de dados Descrição
Sem dados Defina o estado da regra de alerta comoNoData.
Geração de alertas Defina o estado da regra de alerta comoAlerting.
Manter o último estado Mantenha o estado atual da regra de alerta, seja ele qual for.
Ok Compatível, mas geralmente não é útil.

Erros de execução ou tempos limite

As opções a seguir mostram ao Amazon Managed Grafana como lidar com erros de execução ou de tempo limite.

Opção de erro ou tempo limite Descrição
Geração de alertas Defina o estado da regra de alerta comoAlerting.
Manter o último estado Mantenha o estado atual da regra de alerta, seja ele qual for.

Se você tiver um armazenamento de séries temporais não confiável, no qual as consultas às vezes expiram ou falham aleatoriamente, você pode definir essa opção Keep Last State para basicamente ignorá-las.

Notificações

Na guia Alerta, você também pode especificar notificações da regra de alerta e uma mensagem detalhada sobre a regra de alerta. A mensagem pode conter qualquer coisa: informações sobre como você pode resolver o problema, link para o runbook e assim por diante.

As notificações reais são configuradas e compartilhadas entre vários alertas. Para obter informações sobre como configurar e configurar notificações, consulteNotificações de alerta.

  • Enviar para — Selecione um canal de notificação de alerta se você tiver um configurado.

  • Mensagem — Insira uma mensagem de texto a ser enviada no canal de notificação. Alguns notificadores de alerta oferecem suporte à transformação do texto em HTML ou em outros formatos avançados.

  • Tags — especifique uma lista de tags (valor-chave) a serem incluídas na notificação. Ele é suportado apenas por alguns notificadores.

Histórico e anotações do estado do alerta

As alterações do estado de alerta são registradas na tabela de anotação interna no banco de dados Amazon Managed Grafana. As mudanças de estado são visualizadas como anotações no painel gráfico da regra de alerta. Você também pode acessar o State history submenu na guia Alerta para visualizar e limpar o histórico do estado.