OPS04-BP02 Mise en œuvre de la télémétrie de l'application - Pilier Excellence opérationnelle

OPS04-BP02 Mise en œuvre de la télémétrie de l'application

La télémétrie de l'application est la pierre angulaire de l'observabilité de votre charge de travail. Il est essentiel de diffuser des données télémétriques fournissant des informations exploitables sur l'état de votre application et sur son taux de réussite par rapport aux résultats techniques et commerciaux. Qu'il s'agisse de résoudre des problèmes, de mesurer l'impact d'une nouvelle fonctionnalité ou de garantir l'alignement sur les indicateurs clés de performance (KPI) de l'entreprise, la télémétrie de l'application vous permet de créer, d'exploiter et de faire évoluer votre charge de travail.

Les métriques, les journaux et les données de suivi constituent les trois principaux piliers de l'observabilité. Ils servent d'outils de diagnostic qui décrivent l'état de votre application. Au fil du temps, ils contribuent à créer des points de référence et à identifier les anomalies. Cependant, pour garantir l'alignement entre les activités de surveillance et les objectifs commerciaux, il est essentiel de définir et de surveiller les KPI. Les KPI commerciaux facilitent souvent l'identification des problèmes par rapport aux seules métriques techniques.

D'autres types de télémétrie, tels que la surveillance des utilisateurs réels (RUM) et les transactions synthétiques, complètent ces sources de données principales. RUM fournit des informations sur les interactions des utilisateurs en temps réel, tandis que les transactions synthétiques simulent les comportements potentiels des utilisateurs, ce qui contribue à détecter les goulets d’étranglement avant que les utilisateurs réels ne soient affectés.

Résultat souhaité : obtenez des informations exploitables sur les performances de votre charge de travail. Ces informations vous permettront de prendre des décisions proactives concernant l’optimisation des performances, d’accroître la stabilité de la charge de travail, de rationaliser les processus CI/CD et d’utiliser efficacement les ressources.

Anti-modèles courants :

  • Observabilité incomplète : le fait de négliger d’intégrer l’observabilité à chaque niveau de la charge de travail entraîne des angles morts susceptibles de masquer des informations essentielles sur les performances et le comportement du système.

  • Vue fragmentée des données : lorsque les données sont dispersées entre plusieurs outils et systèmes, il devient difficile de conserver une vision globale de l’état et des performances de la charge de travail.

  • Problèmes signalés par les utilisateurs : indique que la détection proactive des problèmes par le biais de la télémétrie et de la surveillance des indicateurs clés de performance de l’entreprise fait défaut.

Avantages de la mise en place de cette bonne pratique :

  • Prise de décision éclairée : grâce aux informations issues de la télémétrie et des KPI commerciaux, vous pouvez prendre des décisions basées sur les données.

  • Efficacité opérationnelle améliorée : l’utilisation des ressources axée sur les données est source de rentabilité.

  • Stabilité accrue de la charge de travail : détection et résolution plus rapides des problèmes, ce qui améliore la disponibilité.

  • Processus CI/CD rationalisés : les informations issues des données de télémétrie facilitent l’affinement des processus et la livraison fiable du code.

Niveau de risque exposé si cette bonne pratique n’est pas respectée : élevé

Directives d’implémentation

Pour implémenter la télémétrie des applications pour votre charge de travail, utilisez des services AWS comme Amazon CloudWatch et AWS X-Ray. Amazon CloudWatch fournit une suite complète d’outils de surveillance, vous permettant d’observer vos ressources et vos applications dans AWS et sur site. Il collecte, suit et analyse les métriques, consolide et surveille les données des journaux, et répond à l’évolution de vos ressources, vous permettant ainsi de mieux comprendre le fonctionnement de votre charge de travail. En tandem, AWS X-Ray vous permet de suivre, d’analyser et de déboguer vos applications, ce qui vous permet aussi de mieux comprendre le comportement de votre charge de travail. Avec des fonctionnalités telles que les cartographies des services, les distributions de latence et les chronologies de suivi, AWS X-Ray fournit des informations sur les performances de votre charge de travail et les obstacles qui l’affectent.

Étapes d’implémentation

  1. Identifiez les données à collecter : déterminez les métriques, les journaux et les données de suivi essentiels qui fourniraient des informations substantielles sur l’état, les performances et le comportement de votre charge de travail.

  2. Déployez l’agent CloudWatch : l’agent CloudWatch joue un rôle essentiel dans l’obtention des métriques et des journaux liés au système et aux applications à partir de votre charge de travail et de son infrastructure sous-jacente. L’agent CloudWatch peut également être utilisé pour collecter des données de suivi OpenTelemetry ou X-Ray et les envoyer à X-Ray.

  3. Mettez en œuvre la détection des anomalies pour les journaux et les métriques : utilisez la détection des anomalies CloudWatch Logs et la détection des anomalies Metrics CloudWatch pour identifier automatiquement les activités inhabituelles dans le fonctionnement de votre application. Ces outils utilisent des algorithmes de machine learning pour détecter les anomalies et émettre des alertes en cas d’anomalie, ce qui améliore vos capacités de surveillance et accélère le temps de réponse en cas de perturbations ou de menaces de sécurité potentielles. Configurez ces fonctionnalités pour gérer de manière proactive l’intégrité et la sécurité des applications.

  4. Sécurisez les données de journal sensibles : utilisez la protection des données Amazon CloudWatch Logs pour masquer les informations sensibles dans vos journaux. Cette fonctionnalité permet de préserver la confidentialité et la conformité grâce à la détection automatique et au masquage des données sensibles avant leur accès. Mettez en œuvre le masquage des données pour gérer et protéger les informations sensibles de manière sécurisée, telles que les données d’identification personnelle (PII).

  5. Définissez et surveillez les indicateurs de performance clés de votre entreprise : mettez en place des métriques personnalisées qui correspondent à vos résultats commerciaux.

  6. Instrumentez votre application avec AWS X-Ray : outre le déploiement de l’agent CloudWatch, il est essentiel d’instrumenter votre application pour qu’elle émette des données de suivi. Ce processus peut fournir des informations supplémentaires sur le comportement et les performances de votre charge de travail.

  7. Standardisez la collecte de données dans l’ensemble de votre application : standardisez les pratiques de collecte de données dans l’ensemble de votre application. L’uniformité facilite la corrélation et l’analyse des données, fournissant ainsi une vue complète du comportement de votre application.

  8. Mettez en œuvre l’observabilité multicompte : améliorez l’efficacité de la surveillance entre plusieurs comptes Comptes AWS grâce à l’observabilité multicompte Amazon CloudWatch. Grâce à cette fonctionnalité, vous pouvez regrouper les métriques, les journaux et les alarmes de différents comptes en une seule vue, ce qui simplifie la gestion et améliore les temps de réponse aux problèmes identifiés dans l’environnement AWS de votre organisation.

  9. Analysez les données et agissez en conséquence : une fois que la collecte et la normalisation des données sont en place, utilisez Amazon CloudWatch pour l’analyse des métriques et des journaux, ainsi que AWS X-Ray pour l’analyse des données de suivi. Une telle analyse peut fournir des informations cruciales sur l’état, les performances et le comportement de votre charge de travail, orientant ainsi votre processus décisionnel.

Niveau d’effort du plan d’implémentation : élevé

Ressources

Bonnes pratiques associées :

Documents connexes :

Vidéos connexes :

Exemples connexes :