Criação de regras de alerta gerenciadas pela Grafana - Amazon Managed Grafana

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criação de regras de alerta gerenciadas pela Grafana

Este tópico de documentação foi desenvolvido para espaços de trabalho do Grafana que oferecem suporte ao Grafana versão 9.x.

Para espaços de trabalho do Grafana que suportam a versão 8.x do Grafana, consulte. Trabalhando na versão 8 da Grafana

O Grafana permite criar regras de alerta que consultam uma ou mais fontes de dados, reduzem ou transformam os resultados e os comparam entre si ou com limites fixos. Quando eles são executados, o Grafana envia notificações para o ponto de contato.

Para adicionar uma regra gerenciada do Grafana
  1. No console do Grafana, no menu Grafana, escolha o ícone de Alerta (sino) para abrir a página de Alerta listando os alertas existentes.

  2. Escolha Nova regra de alerta.

  3. Na Etapa 1, adicione o nome, o tipo e o local de armazenamento da regra, da seguinte forma:

    • Em Nome da regra, adicione um nome descritivo. Esse nome é exibido na lista de regras de alerta. Também é o alertname rótulo de cada instância de alerta criada a partir dessa regra.

    • No menu suspenso Tipo de regra, selecione Alerta gerenciado pela Grafana.

    • No menu suspenso Pasta, selecione a pasta em que você deseja armazenar a regra. Se você não selecionar uma pasta, a regra será armazenada na General pasta. Para criar uma pasta, selecione o menu suspenso e insira um novo nome para a pasta.

  4. Na Etapa 2, adicione as consultas e expressões a serem avaliadas.

    • Mantenha o nome padrão ou passe o mouse sobre ele e escolha o ícone de edição para alterar o nome.

    • Para consultas, selecione uma fonte de dados no menu suspenso.

    • Adicione uma ou mais consultas ou expressões.

    • Para cada expressão, selecione a condição Clássica para criar uma única regra de alerta ou escolha entre as opções Matemática, Redução e Reamostragem para gerar alertas separados para cada série. Para obter detalhes sobre essas opções, consulteRegras únicas e multidimensionais.

    • Escolha Executar consultas para verificar se a consulta foi bem-sucedida.

  5. Na Etapa 3, adicione condições.

    • No menu suspenso Condição, selecione a consulta ou expressão para iniciar a regra de alerta.

    • Em Avaliar cada, especifique a frequência da avaliação. Deve ser um múltiplo de 10 segundos. Por exemplo, 1m, 30s.

    • Em Evaluate for, especifique por quanto tempo a condição deve ser verdadeira antes que um alerta seja iniciado.

      nota

      Depois que uma condição é violada, o alerta entra em Pending estado. Se a condição permanecer violada pelo período especificado, o alerta será transferido para o Firing estado. Se não for mais cumprido, ele reverte para o Normal estado.

    • Em Configurar sem dados e tratamento de erros, configure o comportamento de alerta na ausência de dados. Use as diretrizes em. Sem lidar com dados ou casos de erro

    • Escolha Visualizar alertas para verificar o resultado da execução da consulta no momento. A visualização prévia não exclui dados e condições de tratamento de erros.

  6. Na Etapa 4, adicione outros metadados associados à regra.

    • Adicione uma descrição e um resumo para personalizar as mensagens de alerta. Use as diretrizes emEtiquetas e anotações.

    • Adicione o URL, o painel, o painel e os IDs de alerta do Runbook.

    • Adicione etiquetas personalizadas.

  7. Escolha Salvar para salvar a regra ou Salvar e sair para salvar a regra e voltar para a página de alertas.

Depois de criar sua regra, você pode criar uma notificação para sua regra. Para obter mais informações sobre notificações, consulte Gerencie suas notificações de alerta.

Regras únicas e multidimensionais

Para as regras de alerta gerenciadas da Grafana, você pode criar uma regra com uma condição clássica ou criar uma regra multidimensional.

Regra unidimensional (condição clássica)

Use uma expressão de condição clássica para criar uma regra que inicia um único alerta quando sua condição é atendida. Para uma consulta que retorna várias séries, o Grafana não rastreia o estado de alerta de cada série. Como resultado, o Grafana envia apenas um único alerta, mesmo quando as condições de alerta são atendidas para várias séries.

Para obter mais informações sobre como formatar expressões, consulte Expressões na documentação da Grafana.

Regra multidimensional

Para gerar uma instância de alerta separada para cada série retornada na consulta, crie uma regra multidimensional.

nota

Cada instância de alerta gerada por uma regra multidimensional conta para sua cota total de alertas. As regras não são avaliadas quando você atinge sua cota de alertas. Para obter mais informações sobre cotas para regras multidimensionais, consulte. Erros de cota atingida

Para criar várias instâncias a partir de uma única regra MathReduce, uso ou Resample expressões para criar uma regra multidimensional. Por exemplo, é possível:

  • Adicione uma Reduce expressão para cada consulta para agregar valores no intervalo de tempo selecionado em um único valor. (Não é necessário para regras que usam dados numéricos).

  • Adicione uma Math expressão com a condição para a regra. Isso não é necessário caso uma consulta ou expressão de redução já retorne 0 se a regra não iniciar um alerta, ou um número positivo se ela precisar iniciar um alerta.

    Alguns exemplos:

    • $B > 70se ele deve iniciar um alerta caso o valor da consulta/expressão B seja maior que 70.

    • $B < $C * 100caso deva iniciar um alerta se o valor de B for menor que o valor de C multiplicado por 100. Se as consultas que estão sendo comparadas tiverem várias séries em seus resultados, as séries de consultas diferentes serão correspondidas se tiverem os mesmos rótulos ou se uma for um subconjunto da outra.

nota

Grafana não oferece suporte a consultas de alerta com variáveis de modelo. Mais informações estão disponíveis na página da comunidade As variáveis de modelo não são suportadas nas consultas de alerta durante a configuração do Alert.

Considerações de desempenho para regras multidimensionais

Cada instância de alerta conta para a cota de alerta. As regras multidimensionais que criam mais instâncias do que as que podem ser acomodadas na cota de alerta não são avaliadas e retornam um erro de cota. Para ter mais informações, consulte Erros de cota atingida.

Os alertas multidimensionais podem ter um alto impacto no desempenho do seu espaço de trabalho do Grafana, bem como no desempenho de suas fontes de dados, pois o Grafana as consulta para avaliar suas regras de alerta. As considerações a seguir podem ser úteis quando você está tentando otimizar o desempenho do seu sistema de monitoramento.

  • Frequência da avaliação da regra — A opção Avaliar cada propriedade de uma regra de alerta controla a frequência da avaliação da regra. Recomendamos usar a menor frequência de avaliação aceitável.

  • Cardinalidade do conjunto de resultados — O número de instâncias de alerta que você cria com uma regra afeta seu desempenho. Suponha que você esteja monitorando os erros de resposta da API para cada caminho de API, em cada VM da sua frota. Esse conjunto tem uma cardinalidade do número de caminhos multiplicado pelo número de VMs. Você pode reduzir a cardinalidade do conjunto de resultados, por exemplo, monitorando o total de erros por VM em vez de por caminho por VM.

  • Complexidade da consulta — consultas que as fontes de dados podem processar e responder rapidamente consomem menos recursos. Embora essa consideração seja menos importante do que as outras listadas acima, se você as reduziu ao máximo, observar o desempenho de consultas individuais pode fazer a diferença. Você também deve estar ciente do impacto no desempenho que a avaliação dessas regras tem em suas fontes de dados. As consultas de alerta geralmente são a grande maioria das consultas tratadas pelos bancos de dados de monitoramento, portanto, os mesmos fatores de carga que afetam a instância do Grafana também as afetam.

Erros de cota atingida

Há uma cota para o número de instâncias de alerta que você pode ter em um único espaço de trabalho. Ao atingir esse número, você não poderá mais criar novas regras de alerta nesse espaço de trabalho. Com alertas multidimensionais, o número de instâncias de alerta pode variar com o tempo.

É importante lembrar o seguinte ao trabalhar com instâncias de alerta.

  • Se você criar somente regras unidimensionais, cada regra será uma única instância de alerta. Você pode criar o mesmo número de regras em um único espaço de trabalho que sua cota de instância de alerta, e nada mais.

  • Regras multidimensionais criam várias instâncias de alerta, no entanto, o número não é conhecido até que sejam avaliadas. Por exemplo, se você criar uma regra de alerta que rastreia o uso da CPU de suas instâncias do Amazon EC2, pode haver 50 instâncias do EC2 quando você a cria (e, portanto, 50 instâncias de alerta), mas se você adicionar mais 10 instâncias do EC2 uma semana depois, a próxima avaliação terá 60 instâncias de alerta.

    O número de instâncias de alerta é avaliado quando você cria um alerta multidimensional, e você não pode criar um que o coloque imediatamente acima da cota de instâncias de alerta. Como o número de instâncias de alerta pode mudar, sua cota é verificada sempre que suas regras são avaliadas.

  • No momento da avaliação da regra, se uma regra fizer com que você ultrapasse sua cota para instâncias de alerta, essa regra não será avaliada até que uma atualização seja feita na regra de alerta que coloque a contagem total de instâncias de alerta abaixo da cota de serviço. Quando isso acontece, você recebe uma notificação de alerta informando que sua cota foi atingida (a notificação usa a política de notificação da regra que está sendo avaliada). A notificação inclui uma Error anotação com o valor. QuotaReachedError

  • Uma regra que faz com que uma QuotaReachedError parada seja avaliada. A avaliação só é retomada quando uma atualização é feita e a avaliação após a atualização não causa, por si só, umaQuotaReachedError. Uma regra que não está sendo avaliada mostra o erro de cota atingida no console da Grafana.

  • Você pode reduzir o número de instâncias de alerta removendo as regras de alerta ou editando alertas multidimensionais para ter menos instâncias de alerta (por exemplo, ter um alerta sobre erros por VM, em vez de um alerta sobre erros por API em uma VM).

  • Para retomar as avaliações, atualize o alerta e salve-o. Você pode atualizá-lo para diminuir o número de instâncias de alerta ou, se tiver feito outras alterações para diminuir o número de instâncias de alerta, poderá salvá-lo sem alterações. Se puder ser retomado, é. Se isso causar outroQuotaReachedError, você não poderá salvá-lo.

  • Quando um alerta é salvo e retoma a avaliação sem ultrapassar a cota de alertas, o erro Cota atingida pode continuar sendo exibido no console da Grafana por algum tempo (até o intervalo de avaliação). No entanto, a avaliação da regra de alerta é iniciada e os alertas são enviados se o limite da regra for atingido.

  • Para obter detalhes sobre a cota de alertas, bem como outras cotas, consulte. Cotas do serviço Amazon Managed Grafana

Sem lidar com dados ou casos de erro

Escolha opções de como lidar com o comportamento de alerta na ausência de dados ou quando há erros.

As opções para lidar com nenhum dado estão listadas na tabela a seguir.

Sem opção de dados Comportamento

Sem dados

Crie um alerta DatasourceNoData com o nome e o UID da regra de alerta e o UID da fonte de dados que não retornou dados como rótulos.

Geração de alertas

Defina o estado da regra de alerta comoAlerting.

OK

Defina o estado da regra de alerta comoNormal.

As opções para lidar com casos de erro estão listadas na tabela a seguir.

Opção de erro ou tempo limite Comportamento

Geração de alertas

Defina o estado da regra de alerta como Alerting

OK

Defina o estado da regra de alerta como Normal

Erro

Crie um alerta DatasourceError com o nome e o UID da regra de alerta e o UID da fonte de dados que não retornou dados como rótulos.