OPS08-BP01 Analisar métricas da workload - Pilar Excelência operacional

OPS08-BP01 Analisar métricas da workload

Depois de implementar a telemetria de aplicações, analise regularmente as métricas coletadas. Embora a latência, as solicitações, os erros e a capacidade (ou cotas) forneçam informações sobre a performance do sistema, é fundamental priorizar a análise das métricas de resultados comerciais. Isso garante que você esteja tomando decisões orientadas por dados alinhadas aos seus objetivos de negócios.

Resultado desejado: insights precisos sobre a performance da workload que impulsionam decisões baseadas em dados, garantindo o alinhamento com os objetivos de negócios.

Práticas comuns que devem ser evitadas:

  • Análise das métricas isoladamente, sem considerar seu impacto nos resultados comerciais.

  • Confiança excessiva em métricas técnicas e, ao mesmo tempo, marginalização das métricas de negócios.

  • Revisão pouco frequente das métricas, perdendo oportunidades de tomada de decisão em tempo real.

Benefícios de implementar esta prática recomendada:

  • Compreensão aprimorada da correlação entre performance técnica e resultados comerciais.

  • Processo de tomada de decisão aprimorado baseado em dados em tempo real.

  • Identificação proativa e mitigação de problemas antes que eles afetem os resultados comerciais.

Nível de risco exposto se esta prática recomendada não for estabelecida: Médio

Orientação para implementação

Utilize ferramentas como o Amazon CloudWatch para realizar análises métricas. Serviços da AWS como a deteção de anomalias do CloudWatch e o Amazon DevOps Guru podem ser usados para detectar anomalias, especialmente quando os limites estáticos são desconhecidos ou quando os padrões de comportamento são mais adequados para a detecção de anomalias.

Etapas de implementação

  1. Analise e revise: revise e interprete regularmente suas métricas de workload.

    1. Priorize as métricas de resultados comerciais em vez das métricas puramente técnicas.

    2. Entenda a importância de picos, quedas ou padrões em seus dados.

  2. Utilize o Amazon CloudWatch: use o Amazon CloudWatch para uma visão centralizada e uma análise aprofundada.

    1. Configure painéis do CloudWatch para visualizar suas métricas e compará-las ao longo do tempo.

    2. Use percentis no CloudWatch para obter uma visão clara da distribuição métrica, o que pode ajudar na definição de SLAs e na compreensão de valores discrepantes.

    3. Configure a detecção de anomalias do CloudWatch para identificar padrões incomuns sem depender de limites estáticos.

    4. Implemente a observabilidade entre contas do CloudWatch para monitorar e solucionar problemas de aplicações que abrangem várias contas em uma região.

    5. Use o CloudWatch Metric Insights para consultar e analisar dados métricos em contas e regiões, identificando tendências e anomalias.

    6. Aplique o CloudWatch Metric Math para transformar, agregar ou realizar cálculos em suas métricas para obter insights mais profundos.

  3. Use o Amazon DevOps Guru: incorpore o Amazon DevOps Guru por sua detecção de anomalias aprimorada por machine learning para identificar sinais precoces de problemas operacionais em suas aplicações sem servidor e corrigi-los antes que afetem seus clientes.

  4. Otimize com base em insights: tome decisões informadas baseadas na análise das métricas para ajustar e melhorar as workloads.

Nível de esforço do plano de implementação: Médio

Recursos

Práticas recomendadas relacionadas:

Documentos relacionados:

Vídeos relacionados:

Exemplos relacionados: