OPS04-BP05 Mise en œuvre du suivi distribué - AWS Well-Architected Framework

OPS04-BP05 Mise en œuvre du suivi distribué

Le suivi distribué permet de surveiller et de visualiser les requêtes lorsqu'elles traversent les différents composants d'un système distribué. En capturant les données de suivi provenant de plusieurs sources et en les analysant dans une vue unifiée, les équipes peuvent mieux comprendre le flux des requêtes, les endroits où les goulots d'étranglement ont lieu et les domaines dans lesquels les efforts d'optimisation doivent se concentrer.

Résultat souhaité : Bénéficiez d'une vue globale des requêtes circulant dans votre système distribué, ce qui permet un débogage précis, des performances optimisées et une meilleure expérience utilisateur.

Anti-modèles courants :

  • Instrumentation incohérente : les services d'un système distribué ne sont pas tous instrumentés pour le suivi.

  • Ignorer la latence : se concentrer uniquement sur les erreurs et ne pas tenir compte de la latence ou de la dégradation progressive des performances.

Avantages liés au respect de cette bonne pratique :

  • Vue d'ensemble complète du système : visualisation du parcours complet des requêtes, de l'entrée à la sortie.

  • Débogage amélioré : identification rapide des défaillances ou des problèmes de performance.

  • Expérience utilisateur améliorée : surveillance et optimisation basées sur des données sur les utilisateurs réels, afin de garantir que le système répond aux exigences du monde réel.

Niveau d'exposition au risque si cette bonne pratique n'est pas respectée : Élevé

Directives d'implémentation

Commencez par identifier tous les éléments de votre charge de travail qui nécessitent de l'instrumentation. Une fois que tous les composants sont pris en compte, utilisez des outils tels qu'OpenTelemetry et AWS X-Ray pour collecter des données de suivi à des fins d'analyse à l'aide d'outils comme X-Ray et Amazon CloudWatch ServiceLens Map. Participez à des révisions régulières avec les développeurs et complétez ces discussions avec des outils comme Amazon DevOps Guru, X-Ray Analytics et X-Ray Insights pour découvrir des résultats plus approfondis. Définissez des alertes à partir des données de suivi pour envoyer une notification lorsque les résultats, tels que décrits dans le plan de surveillance de la charge de travail, sont menacés.

Étapes d'implémentation

Pour mettre en œuvre efficacement le suivi distribué :

  1. Adoptez AWS X-Ray : Intégrez X-Ray à votre application pour mieux comprendre son comportement, interpréter ses performances et identifier les goulots d'étranglement. Utilisez X-Ray Insights pour l'analyse automatique des données de suivi.

  2. Instrumentez vos services : Vérifiez que chaque service, d'une fonction AWS Lambda à une instance EC2, envoie des données de suivi. Plus vous instrumentez de services, plus la vue de bout en bout est claire.

  3. Incorporez la surveillance des utilisateurs réels CloudWatch et la surveillance synthétique : Intégrez la surveillance des utilisateurs réels (RUM) et la surveillance synthétique avec X-Ray. Cela permet de capturer des expériences utilisateur réelles et de simuler les interactions des utilisateurs afin d'identifier les problèmes potentiels.

  4. Utilisez l'agent CloudWatch : Cet agent peut envoyer des données de suivi depuis X-Ray ou OpenTelemetry, améliorant ainsi la profondeur des informations obtenues.

  5. Utilisez Amazon DevOps Guru : DevOps Guru utilise des données provenant de X-Ray, CloudWatch, AWS Config et AWS CloudTrail pour fournir des recommandations exploitables.

  6. Analysez les données de suivi : Passez régulièrement en revue les données de suivi pour identifier les tendances, les anomalies ou les goulots d'étranglement susceptibles d'avoir un impact sur les performances de votre application.

  7. Configurez des alertes : Configurez des alarmes dans CloudWatch pour les tendances inhabituelles ou les latences prolongées, ce qui permet de résoudre les problèmes de manière proactive.

  8. Amélioration continue : Revoyez votre stratégie de suivi au fur et à mesure que des services sont ajoutés ou modifiés afin de capturer tous les points de données pertinents.

Niveau d'effort du plan d'implémentation : Moyen

Ressources

Bonnes pratiques associées :

Documents connexes :

Vidéos connexes :

Exemples connexes :