As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Melhores práticas em DevOps Guru
As práticas recomendadas a seguir podem ajudá-lo a entender, diagnosticar e corrigir comportamentos anômalos detectados pelo Amazon DevOps Guru. Use as práticas recomendadas doEntendendo os insights no console do DevOps Gurupara resolver problemas operacionais detectados pelo DevOps Guru.
-
Na visualização da linha do tempo de um insight, veja as métricas destacadas primeiro. Eles geralmente são indicadores-chave do problema.
-
Use o Amazon CloudWatch para exibir métricas que ocorreram imediatamente antes da primeira métrica destacada em um insight para identificar quando e como o comportamento mudou. Isso pode ajudar a diagnosticar e corrigir o problema.
-
Para recursos do Amazon RDS, veja as métricas do Performance Insights. Ao correlacionar métricas de contador com a carga do banco de dados, você pode obter informações detalhadas sobre problemas de desempenho. Para obter mais informações, consulteAnalisando anomalias de desempenho com o DevOps Gurufor Amazon RDS.
-
Várias dimensões da mesma métrica geralmente podem ser anômalas. Veja as dimensões na visão gráfica para obter uma compreensão mais profunda do problema.
-
Procure na seção eventos de um insight para eventos de implantação ou infraestrutura que aconteceram no momento em que o insight foi criado. Saber quais eventos ocorreram quando o comportamento anômalo de um insight ocorreu pode ajudá-lo a entender e diagnosticar o problema.
-
Procure por tickets em seu sistema operacional que aconteceram na mesma época que um insight para pistas.
-
Em uma visão, leia as recomendações e visite os links nas recomendações. Eles geralmente têm etapas de solução de problemas que podem ajudá-lo a diagnosticar e resolver problemas rapidamente.
-
Não ignore insights resolvidos, a menos que você já tenha resolvido o problema. Uma vez por dia, veja novos insights, mesmo que tenham sido resolvidos. Tente entender a causa raiz por trás de tantos insights quanto você puder. Procure um padrão que possa ser o sinal de um problema sistêmico. Se um problema sistêmico não for resolvido, isso pode causar problemas mais sérios no futuro. Corrigir problemas transitórios agora pode ajudar a evitar incidentes futuros e mais graves.