OPS08-BP03 Analisar rastreamentos de workload - AWS Well-Architected Framework

OPS08-BP03 Analisar rastreamentos de workload

Analisar dados de rastreamento é crucial para obter uma visão abrangente da jornada operacional de uma aplicação. Ao visualizar e compreender as interações entre vários componentes, a performance pode ser ajustada, os gargalos identificados e as experiências do usuário aprimoradas.

Resultado desejado: tenha uma visibilidade clara das operações distribuídas da sua aplicação, permitindo uma resolução mais rápida de problemas e uma experiência de usuário aprimorada.

Antipadrões comuns:

  • Ignorar dados de rastreamento, confiando apenas em logs e métricas.

  • Não correlacionar dados de rastreamento com logs associados.

  • Ignorar as métricas derivadas de rastreamentos, como latência e taxas de falhas.

Benefícios de estabelecer esta desta prática recomendada:

  • Aprimoramento da solução de problemas e redução do tempo médio de resolução (MTTR).

  • Insights sobre dependências e seu impacto.

  • Identificação e correção rápidas de problemas de desempenho.

  • Uso de métricas derivadas de rastreamento para uma tomada de decisão informada.

  • Experiências de usuário aprimoradas por meio de interações otimizadas de componentes.

Nível de exposição a riscos se esta prática recomendada não for estabelecida: médio

Orientações para a implementação

O AWS X-Ray oferece um pacote abrangente para análise de dados de rastreamento, fornecendo uma visão holística das interações de serviços, monitorando as atividades do usuário e detectando problemas de performance. Recursos como ServiceLens, X-Ray Insights, X-Ray Analytics e Amazon DevOps Guru aprimoram o detalhamento dos insights acionáveis derivados de dados de rastreamento.

Etapas da implementação

As seguintes etapas oferecem uma abordagem estruturada para implementar com eficácia a análise de dados de rastreamento usando serviços da AWS:

  1. Integre o AWS X-Ray: integre o X-Ray às aplicações para registrar dados de rastreamento.

  2. Analise métricas do X-Ray: aprofunde-se em métricas derivadas dos rastreamentos do X-Ray, como latência, taxas de solicitação, taxas de falhas e distribuições de tempo de resposta, usando o mapa de serviços para monitorar a integridade da aplicação.

  3. Use o ServiceLens: utilize o mapa do ServiceLens para melhorar a observabilidade de serviços e aplicações. Isso permite a visualização integrada de rastreamentos, métricas, logs, alarmes e outras informações de integridade.

  4. Habilite o X-Ray Insights:

    1. Ative o X-Ray Insights para detecção automática de anomalias em rastreamentos.

    2. Examine os insights para identificar padrões e determinar as causas principais, como maiores taxas de falhas ou latências.

    3. Consulte o cronograma de insights para uma análise cronológica dos problemas detectados.

  5. Use o X-Ray: o X-Ray Analytics permite que você explore minuciosamente os dados de rastreamento, identifique padrões e extraia insights.

  6. Use grupos no X-Ray: crie grupos no X-Ray para filtrar rastreamentos com base em critérios, como alta latência, permitindo uma análise mais direcionada.

  7. Incorpore o Amazon DevOps Guru: utilize o Amazon DevOps Guru para se beneficiar dos modelos de machine learning que identificam anomalias operacionais nos rastreamentos.

  8. Use o CloudWatch Synthetics: use o CloudWatch Synthetics para criar canários e monitorar continuamente os endpoints e os fluxos de trabalho. Esses canários podem integrar-se ao X-Ray para fornecer dados de rastreamento para uma análise detalhada das aplicações que estão sendo testadas.

  9. Use monitoramento de usuário real (RUM): com o AWS X-Ray e o CloudWatch RUM, você pode analisar e depurar o caminho da solicitação a partir dos usuários finais da aplicação por meio de serviços gerenciados subsequentes da AWS. Isso ajuda você a identificar erros e tendências de latência que afetam os usuários.

  10. Correlacione com logs: correlacione o dados de rastreamento com logs relacionados na visualização de rastreamento do X-Ray para ter uma perspectiva detalhada do comportamento da aplicação. Isso permite que você visualize eventos de log diretamente associados às transações rastreadas.

  11. Implemente a observabilidade entre contas do CloudWatch: monitore e solucione problemas de aplicações que abrangem várias contas em uma região.

Nível de esforço do plano de implementação: médio

Recursos

Práticas recomendadas relacionadas:

Documentos relacionados:

Vídeos relacionados:

Exemplos relacionados: