Práticas recomendadas no DevOps Guru - DevOps Guru da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Práticas recomendadas no DevOps Guru

As práticas recomendadas a seguir podem ajudar a entender, diagnosticar e corrigir comportamentos anômalos detectados pelo Amazon DevOps Guru. Use as práticas recomendadas com o Entender os insights no console do DevOps Guru para resolver problemas operacionais detectados pelo DevOps Guru.

  • Na visualização do cronograma de um insight, veja primeiro os indicadores destacados. Eles geralmente são indicadores-chave do problema.

  • Use o Amazon CloudWatch para visualizar indicadores que ocorreram imediatamente antes do primeiro indicador destacado em um insight para identificar quando e como o comportamento mudou. Vocês podem me ajudar a diagnosticar o problema?

  • Para recursos do Amazon RDS, veja os indicadores do Performance Insights. Ao correlacionar os indicadores do contador com a carga do banco de dados, você pode obter informações detalhadas sobre problemas de desempenho. Para obter mais informações, consulte Como analisar anomalias de desempenho com o DevOps Guru para Amazon RDS.

  • Muitas vezes, várias dimensões do mesmo indicador podem ser anômalas. Veja as dimensões na exibição gráfica para obter uma compreensão mais profunda do problema.

  • Veja na seção de eventos de um insight os eventos de implantação ou infraestrutura que aconteceram na época em que o insight foi criado. Saber quais eventos ocorreram quando o comportamento anômalo de um insight aconteceu pode ajudá-lo a entender e diagnosticar o problema.

  • Procure tíquetes em seu sistema operacional que aconteceram no mesmo momento em busca de pistas.

  • Em uma visão geral, leia as recomendações e acesse os links nas recomendações. Eles geralmente têm etapas de solução de problemas que podem ajudá-lo a diagnosticar e resolver problemas rapidamente.

  • Não ignore os insights resolvidos, a menos que você já tenha resolvido o problema. Uma vez por dia, analise novos insights, mesmo que tenham sido resolvidos. Tente entender a causa raiz por trás do maior número de insights possível. Procure um padrão que possa ser o sinal de um problema sistêmico. Se um problema sistêmico não for resolvido, ele poderá causar problemas mais sérios no futuro. Corrigir problemas transitórios agora pode ajudar a evitar incidentes futuros e mais sérios.