OPS08-BP01 Analizar las métricas de la carga de trabajo - Pilar de excelencia operativa

OPS08-BP01 Analizar las métricas de la carga de trabajo

Después de implementar la telemetría de la aplicación, analice periódicamente las métricas recopiladas. Si bien la latencia, las solicitudes, los errores y la capacidad (o las cuotas) proporcionan información sobre el rendimiento del sistema, es fundamental dar prioridad la revisión de las métricas de resultados empresariales. Esto garantiza que tome decisiones basadas en datos alineadas con sus objetivos empresariales.

Resultado deseado: información veraz sobre el rendimiento de la carga de trabajo que genera decisiones basadas en datos y garantiza la alineación con los objetivos empresariales.

Patrones comunes de uso no recomendados:

  • Analizar las métricas de forma aislada sin tener en cuenta su impacto en los resultados empresariales.

  • Confiar de forma excesiva en las métricas técnicas y, al mismo tiempo, dejar de lado las métricas empresariales.

  • Revisar infrecuentemente las métricas, lo que hace que se pierdan oportunidades de toma de decisiones en tiempo real.

Beneficios de establecer esta práctica recomendada:

  • Comprensión mejorada de la correlación entre el rendimiento técnico y los resultados empresariales.

  • Proceso de toma de decisiones mejorado basado en datos en tiempo real.

  • Identificación y mitigación proactivas de los problemas antes de que afecten a los resultados empresariales.

Nivel de riesgo expuesto si no se establece esta práctica recomendada: Medio

Guía para la implementación

Utilice herramientas como Amazon CloudWatch para realizar análisis de métricas. Los servicios de AWS como AWS Cost Anomaly Detection y Amazon DevOps Guru pueden utilizarse para detectar anomalías, especialmente cuando se desconocen los umbrales estáticos o cuando los patrones de comportamiento son más adecuados para la detección de anomalías.

Pasos para la implementación

  1. Analice y revise: revise e interprete periódicamente las métricas de carga de trabajo.

    1. Dé prioridad a las métricas de resultados empresariales sobre las métricas puramente técnicas.

    2. Comprenda la importancia de los picos, las caídas o los patrones en sus datos.

  2. Utilice Amazon CloudWatch: utilice Amazon CloudWatch para obtener una vista centralizada y un análisis profundo.

    1. Configure paneles de CloudWatch para visualizar sus métricas y compararlas a lo largo del tiempo.

    2. Utilice percentiles en CloudWatch para obtener una vista clara de la distribución de métricas, lo que puede ayudar a definir los SLA y comprender los valores atípicos.

    3. Configure AWS Cost Anomaly Detection para identificar patrones inusuales sin depender de umbrales estáticos.

    4. Implemente la observabilidad multicuenta de CloudWatch para supervisar y solucionar problemas de las aplicaciones que abarcan varias cuentas dentro de una región.

    5. Utilice CloudWatch Metric Insights para consultar y analizar datos de métricas en cuentas y regiones, identificando tendencias y anomalías.

    6. Utilice la calculadora de métricas de CloudWatch para transformar, añadir o realizar cálculos en sus métricas a fin de obtener información más detallada.

  3. Emplee Amazon DevOps Guru: incorpore Amazon DevOps Guru por su detección de anomalías mejorada con machine learning para identificar los primeros signos de problemas operativos en sus aplicaciones sin servidor y solucionarlos antes de que afecten a sus clientes.

  4. Optimice en función de los conocimientos: tome decisiones informadas en función de su análisis de métricas para ajustar y mejorar sus cargas de trabajo.

Nivel de esfuerzo para el plan de implementación: Medio

Recursos

Prácticas recomendadas relacionadas:

Documentos relacionados:

Vídeos relacionados:

Ejemplos relacionados: