As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Práticas recomendadas no DevOps Guru
As práticas recomendadas a seguir podem ajudar a entender, diagnosticar e corrigir comportamentos anômalos detectados pelo Amazon DevOps Guru. Use as práticas recomendadas com o Entender os insights no console do DevOps Guru para resolver problemas operacionais detectados pelo DevOps Guru.
-
Na visualização do cronograma de um insight, veja primeiro os indicadores destacados. Eles geralmente são indicadores-chave do problema.
-
Use o Amazon CloudWatch para visualizar indicadores que ocorreram imediatamente antes do primeiro indicador destacado em um insight para identificar quando e como o comportamento mudou. Vocês podem me ajudar a diagnosticar o problema?
-
Para recursos do Amazon RDS, veja os indicadores do Performance Insights. Ao correlacionar os indicadores do contador com a carga do banco de dados, você pode obter informações detalhadas sobre problemas de desempenho. Para obter mais informações, consulte Como analisar anomalias de desempenho com o DevOps Guru para Amazon RDS.
-
Muitas vezes, várias dimensões do mesmo indicador podem ser anômalas. Veja as dimensões na exibição gráfica para obter uma compreensão mais profunda do problema.
-
Veja na seção de eventos de um insight os eventos de implantação ou infraestrutura que aconteceram na época em que o insight foi criado. Saber quais eventos ocorreram quando o comportamento anômalo de um insight aconteceu pode ajudá-lo a entender e diagnosticar o problema.
-
Procure tíquetes em seu sistema operacional que aconteceram no mesmo momento em busca de pistas.
-
Em uma visão geral, leia as recomendações e acesse os links nas recomendações. Eles geralmente têm etapas de solução de problemas que podem ajudá-lo a diagnosticar e resolver problemas rapidamente.
-
Não ignore os insights resolvidos, a menos que você já tenha resolvido o problema. Uma vez por dia, analise novos insights, mesmo que tenham sido resolvidos. Tente entender a causa raiz por trás do maior número de insights possível. Procure um padrão que possa ser o sinal de um problema sistêmico. Se um problema sistêmico não for resolvido, ele poderá causar problemas mais sérios no futuro. Corrigir problemas transitórios agora pode ajudar a evitar incidentes futuros e mais sérios.