OPS08-BP03 Analizar los rastreos de la carga de trabajo - AWS Well-Architected Framework

OPS08-BP03 Analizar los rastreos de la carga de trabajo

El análisis de los datos de rastreo es crucial para lograr una visión integral del recorrido operativo de una aplicación. Al visualizar y comprender las interacciones entre varios componentes, se puede ajustar el rendimiento, identificar los cuellos de botella y mejorar las experiencias de los usuarios.

Resultado deseado: logre una visibilidad clara de las operaciones distribuidas de su aplicación, lo que permite una resolución de problemas más rápida y una mejor experiencia del usuario.

Antipatrones usuales:

  • Pasar por alto los datos de rastreo y confiar únicamente en los registros y las métricas.

  • No se correlacionan los datos de rastreo con los registros asociados.

  • Hacer caso omiso de las métricas derivadas de los rastreos, como la latencia y las tasas de errores.

Beneficios de establecer esta práctica recomendada:

  • Mejore la solución de problemas y reduzca el tiempo medio de resolución (MTTR).

  • Obtenga información sobre las dependencias y su impacto.

  • Identifique y rectifique rápidamente los problemas de rendimiento.

  • Utilice las métricas derivadas de los rastreos para tomar decisiones informadas.

  • Mejore la experiencia del usuario mediante interacciones de componentes optimizadas.

Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio

Guía para la implementación

AWS X-Ray ofrece un conjunto completo para el análisis de datos de rastreo, que proporciona una visión integral de las interacciones del servicio, supervisa las actividades de los usuarios y detecta problemas de rendimiento. Características como ServiceLens, X-Ray Insights, X-Ray Analytics y Amazon DevOps Guru mejoran la profundidad de la información procesable derivada de los datos de rastreo.

Pasos para la implementación

Los siguientes pasos ofrecen un enfoque estructurado para implementar de manera eficaz el análisis de datos de rastreo mediante servicios de AWS:

  1. Integre AWS X-Ray: asegúrese de que X-Ray esté integrado con sus aplicaciones para obtener datos de rastreo.

  2. Analice las métricas de X-Ray: profundice en las métricas obtenidas de los rastreos de X-Ray, como la latencia, las tasas de solicitudes, las tasas de errores y las distribuciones del tiempo de respuesta, utilizando el mapa de servicios para supervisar el estado de las aplicaciones.

  3. Utilice ServiceLens: aproveche el mapa de ServiceLens para mejorar la observabilidad de sus servicios y aplicaciones. Esto permite la visualización integrada de rastreos, métricas, registros, alarmas y otra información de estado.

  4. Habilite X-Ray Insights:

    1. Active X-Ray Insights para la detección automática de anomalías en los rastreos.

    2. Examine la información para identificar patrones y determinar las causas raíz, como el aumento de tasas de errores o latencias.

    3. Consulte el cronograma de información para obtener un análisis cronológico de los problemas detectados.

  5. Utilice X-Ray Analytics: X-Ray Analytics le permite explorar a fondo los datos de rastreo, identificar patrones y extraer información.

  6. Utilice grupos en X-Ray: cree grupos en X-Ray para filtrar los rastreos en función de criterios como la alta latencia, lo que permite un análisis más específico.

  7. Incorpore Amazon DevOps Guru: utilice Amazon DevOps Guru para beneficiarse de los modelos de machine learning que identifican anomalías operativas en los rastreos.

  8. Utilice CloudWatch Synthetics: utilice CloudWatch Synthetics para crear valores controlados para supervisar continuamente sus puntos de enlace y flujos de trabajo. Estos valores controlados pueden integrarse con X-Ray para proporcionar datos de rastreo para un análisis en profundidad de las aplicaciones que se están probando.

  9. Utilice la supervisión de usuarios reales (RUM): con AWS X-Ray y CloudWatch RUM, puede analizar y depurar la ruta de solicitud desde los usuarios finales de la aplicación hasta los servicios downstream administrados por AWS. Esto le ayuda a identificar las tendencias de latencia y los errores que afectan a sus usuarios finales.

  10. Correlacione con registros: correlacione los datos de seguimiento con los registros relacionados en la vista de rastreo de X-Ray para obtener una perspectiva detallada del comportamiento de las aplicaciones. Esto le permite ver los eventos de registro directamente asociados con las transacciones rastreadas.

  11. Implemente la observabilidad entre cuentas de CloudWatch: supervise y solucione los problemas de las aplicaciones que abarcan varias cuentas dentro de una región.

Nivel de esfuerzo para el plan de implementación: medio.

Recursos

Prácticas recomendadas relacionadas:

Documentos relacionados:

Vídeos relacionados:

Ejemplos relacionados: