Conceitos do DevOps Guru - DevOps Guru da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Conceitos do DevOps Guru

Os seguintes conceitos são importantes para entender como funciona o Amazon DevOps Guru.

Anomalia

Uma anomalia representa uma ou mais métricas relacionadas detectadas pelo DevOps Guru que são inesperadas ou incomuns. O DevOps Guru gera anomalias usando machine learning para analisar métricas e dados operacionais relacionados aos seus recursos de AWS. Você especifica os recursos de AWS que deseja analisar ao configurar o Amazon DevOps Guru. Para obter mais informações, consulte Configurando o Amazon DevOps Guru.

Insight

Um insight é uma coletânea de anomalias criadas durante a análise dos recursos de AWS que você especifica ao configurar o DevOps Guru. Cada insight contém observações, recomendações e dados analíticos que você pode usar para melhorar seu desempenho operacional. Existem dois tipos de insight:

  • Reativo: um insight reativo identifica um comportamento anômalo quando ele ocorre. Contém anomalias com recomendações, métricas relacionadas e eventos para ajudar você a entender e resolver os problemas agora.

  • Proativo: um insight proativo informa você sobre um comportamento anômalo antes que ele ocorra. Contém anomalias com recomendações para ajudar você a resolver os problemas antes de quando estão previstos para acontecer.

Métricas e eventos operacionais

As anomalias que compõem um insight são geradas pela análise das métricas retornadas pelo Amazon CloudWatch e dos eventos operacionais emitidos por seus recursos de AWS. Você pode visualizar as métricas e os eventos operacionais que criam um insight para ajudar você a entender melhor os problemas em seu aplicativo.

Grupos de logs e anomalias de log

Quando você ativa a detecção de anomalias de log, grupos de log relevantes são exibidos nas páginas de insights do DevOps Guru no console do DevOps Guru. Um grupo de logs permite que você tome conhecimento de informações críticas de diagnóstico sobre o desempenho e o acesso de um recurso.

Uma anomalia de log representa um cluster de eventos de log anômalos semelhantes encontrados em um grupo de logs. Exemplos de eventos de log anômalos que podem ser exibidos no DevOps Guru incluem anomalias de palavras-chave, anomalias de formato, anomalias de código HTTP e muito mais.

Você pode usar as anomalias de log para diagnosticar a causa raiz de um problema operacional. O DevOps Guru também faz referência às linhas de log nas recomendações de insights para fornecer mais contexto para as soluções recomendadas.

nota

O DevOps Guru trabalha com o Amazon CloudWatch para permitir a detecção de anomalias de log. Quando você ativa a detecção de anomalias de log, o DevOps Guru adiciona tags aos seus grupos de logs do CloudWatch. Quando você desativa a detecção de anomalias de log, o DevOps Guru remove as tags dos seus grupos de logs do CloudWatch.

Além disso, administradores devem garantir que somente usuários com permissões para visualizar logs do CloudWatch tenham permissão para visualizar logs anômalos do CloudWatch. Recomendamos usar as políticas do IAM para permitir ou negar acesso à operação do ListAnomalousLogs. Para obter mais informações, consulte Gestão de identidade e acesso para o DevOps Guru.

Recomendações

Cada insight fornece recomendações com sugestões para ajudar você a melhorar o desempenho do seu aplicativo. A recomendação inclui:

  • Uma descrição das ações de recomendação para lidar com as anomalias que compõem o insight.

  • Uma lista das métricas analisadas onde o DevOps Guru encontrou um comportamento anômalo. Cada métrica inclui o nome da pilha do AWS CloudFormation que gerou o recurso associado às métricas, o nome do recurso e o nome do serviço do AWS associado ao recurso.

  • Uma lista dos eventos relacionados às métricas anômalas associadas ao insight. Cada evento relacionado contém o nome da pilha do AWS CloudFormation que gerou o recurso associado ao evento, o nome do recurso que gerou o evento e o nome do serviço do AWS associado ao evento.

  • Uma lista dos grupos de logs relacionados aos comportamentos anômalos associados ao insight. Cada grupo de logs contém um exemplo de mensagem de log, informações sobre os tipos de anomalias de log relatadas, os horários em que as anomalias de log ocorreram e um link para visualizar as linhas de log no CloudWatch.