Melhores práticas em DevOps Guru - AmazonDevOps Guru

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Melhores práticas em DevOps Guru

As práticas recomendadas a seguir podem ajudá-lo a entender, diagnosticar e corrigir comportamentos anômalos detectados pelo Amazon DevOps Guru. Use as práticas recomendadas doEntendendo os insights no console do DevOps Gurupara resolver problemas operacionais detectados pelo DevOps Guru.

  • Na visualização da linha do tempo de um insight, veja as métricas destacadas primeiro. Eles geralmente são indicadores-chave do problema.

  • Use o Amazon CloudWatch para exibir métricas que ocorreram imediatamente antes da primeira métrica destacada em um insight para identificar quando e como o comportamento mudou. Isso pode ajudar a diagnosticar e corrigir o problema.

  • Para recursos do Amazon RDS, veja as métricas do Performance Insights. Ao correlacionar métricas de contador com a carga do banco de dados, você pode obter informações detalhadas sobre problemas de desempenho. Para obter mais informações, consulteAnalisando anomalias de desempenho com o DevOps Gurufor Amazon RDS.

  • Várias dimensões da mesma métrica geralmente podem ser anômalas. Veja as dimensões na visão gráfica para obter uma compreensão mais profunda do problema.

  • Procure na seção eventos de um insight para eventos de implantação ou infraestrutura que aconteceram no momento em que o insight foi criado. Saber quais eventos ocorreram quando o comportamento anômalo de um insight ocorreu pode ajudá-lo a entender e diagnosticar o problema.

  • Procure por tickets em seu sistema operacional que aconteceram na mesma época que um insight para pistas.

  • Em uma visão, leia as recomendações e visite os links nas recomendações. Eles geralmente têm etapas de solução de problemas que podem ajudá-lo a diagnosticar e resolver problemas rapidamente.

  • Não ignore insights resolvidos, a menos que você já tenha resolvido o problema. Uma vez por dia, veja novos insights, mesmo que tenham sido resolvidos. Tente entender a causa raiz por trás de tantos insights quanto você puder. Procure um padrão que possa ser o sinal de um problema sistêmico. Se um problema sistêmico não for resolvido, isso pode causar problemas mais sérios no futuro. Corrigir problemas transitórios agora pode ajudar a evitar incidentes futuros e mais graves.