OPS04-BP05 Mise en œuvre du suivi distribué - Framework AWS Well-Architected

OPS04-BP05 Mise en œuvre du suivi distribué

Le suivi distribué permet de surveiller et de visualiser les requêtes lorsqu’elles traversent les différents composants d’un système distribué. En capturant les données de suivi provenant de plusieurs sources et en les analysant dans une vue unifiée, les équipes peuvent mieux comprendre le flux des requêtes, les endroits où les goulots d’étranglement ont lieu et les domaines dans lesquels les efforts d’optimisation doivent se concentrer.

Résultat escompté : bénéficiez d’une vue globale des requêtes circulant dans votre système distribué, ce qui permet un débogage précis, des performances optimisées et une meilleure expérience utilisateur.

Anti-modèles courants :

  • Instrumentation incohérente : les services d’un système distribué ne sont pas tous instrumentés pour le suivi.

  • Ignorer la latence : se concentrer uniquement sur les erreurs et ne pas tenir compte de la latence ou de la dégradation progressive des performances.

Avantages liés au respect de cette bonne pratique :

  • Vue d’ensemble complète du système : visualisation du parcours complet des requêtes, de l’entrée à la sortie.

  • Débogage amélioré : identification rapide des défaillances ou des problèmes de performance.

  • Expérience utilisateur améliorée : surveillance et optimisation basées sur des données sur les utilisateurs réels, afin de garantir que le système répond aux exigences du monde réel.

Niveau d’exposition au risque si cette bonne pratique n’est pas respectée : élevé

Directives d’implémentation

Commencez par identifier tous les éléments de votre charge de travail qui nécessitent de l’instrumentation. Une fois que tous les composants sont pris en compte, utilisez des outils tels que AWS X-Ray et OpenTelemetry pour collecter des données de suivi à des fins d’analyse à l’aide d’outils comme X-Ray et Amazon CloudWatch ServiceLens Map. Engagez des révisions régulières avec les développeurs et complétez ces discussions avec des outils tels qu’Amazon DevOps Guru, X-Ray Analytics et X-Ray Insights pour aider à découvrir des conclusions plus approfondies. Définissez des alertes à partir des données de suivi pour envoyer une notification lorsque les résultats, tels que décrits dans le plan de surveillance de la charge de travail, sont menacés.

Étapes d’implémentation

Pour mettre en œuvre efficacement le suivi distribué :

  1. Adoption de AWS X-Ray : intégrez X-Ray à votre application pour mieux comprendre son comportement, interpréter ses performances et identifier les goulots d’étranglement. Utilisez X-Ray Insights pour l’analyse automatique des données de suivi.

  2. Instrumentation de vos services : vérifiez que chaque service, qu’il s’agisse d’une fonction AWS Lambda ou d’une instance EC2, envoie des données de suivi. Plus vous instrumentez de services, plus la vue de bout en bout est claire.

  3. Intégration de la surveillance des utilisateurs réels et la surveillance synthétique de CloudWatch : intégrez la surveillance des utilisateurs réels (RUM) et la surveillance synthétique avec X-Ray. Cela permet de capturer des expériences utilisateur réelles et de simuler les interactions des utilisateurs afin d’identifier les problèmes potentiels.

  4. Utilisation de l’agent CloudWatch : cet agent peut envoyer des données de suivi depuis ou OpenTelemetry, améliorant ainsi la profondeur des informations obtenues.

  5. Utilisation d’Amazon DevOps Guru : DevOps Guru utilise les données de X-Ray, CloudWatch, AWS Config et AWS CloudTrail pour fournir des recommandations exploitables.

  6. Analyse des traces : passez régulièrement en revue les données de suivi pour identifier les tendances, les anomalies ou les goulots d’étranglement susceptibles d’avoir un impact sur les performances de votre application.

  7. Configuration d’alertes : configurez des alarmes dans CloudWatch pour détecter des modèles inhabituels ou des latences prolongées, ce qui permet de résoudre les problèmes de manière proactive.

  8. Amélioration continue : revoyez votre stratégie de suivi au fur et à mesure que des services sont ajoutés ou modifiés afin de capturer tous les points de données pertinents.

Niveau d’effort du plan d’implémentation : moyen

Ressources

Bonnes pratiques associées :

Documents connexes :

Vidéos connexes :

Exemples connexes :