OPS08-BP01 Analyse des métriques de charge de travail - Pilier Excellence opérationnelle

OPS08-BP01 Analyse des métriques de charge de travail

Après avoir implémenté la télémétrie des applications, analysez régulièrement les métriques collectées. Bien que la latence, les requêtes, les erreurs et la capacité (ou les quotas) fournissent des informations sur les performances du système, il est essentiel de donner la priorité à l’examen des métriques liées aux résultats commerciaux. Vous vous assurez ainsi de prendre des décisions basées sur des données conformes aux objectifs de votre entreprise.

Résultat escompté : informations précises sur les performances des charges de travail afin de prendre des décisions éclairées par les données, garantissant ainsi l’alignement avec les objectifs de votre entreprise.

Anti-modèles courants :

  • Analyse des métriques de manière isolée sans tenir compte de leur impact sur les résultats commerciaux.

  • Se fier de manière excessive aux métriques techniques tout en mettant de côté les métriques commerciales.

  • Examen rare des métriques, ce qui vous fait passer à côté de possibilités de prise de décision en temps réel.

Avantages liés au respect de cette bonne pratique :

  • Meilleure compréhension de la corrélation entre les performances techniques et les résultats commerciaux.

  • Processus décisionnel amélioré grâce à des données en temps réel.

  • Identification et atténuation proactives des problèmes avant qu’ils n’affectent les résultats commerciaux.

Niveau de risque encouru si cette bonne pratique n’est pas respectée : moyen

Directives d’implémentation

Tirez parti d’outils tels qu’Amazon CloudWatch pour effectuer l’analyse des métriques. Des services AWS comme la détection d’anomalies CloudWatch et Amazon DevOps Guru peuvent être utilisés pour détecter les anomalies, en particulier lorsque les seuils statiques sont inconnus ou lorsque les modèles de comportement sont davantage adaptés à la détection d’anomalies.

Étapes d’implémentation

  1. Analyser et revoir : examinez et interprétez régulièrement les données relatives à votre charge de travail.

    1. Donnez la priorité aux métriques liées aux résultats commerciaux par rapport aux métriques purement techniques.

    2. Comprenez l’importance des pics, des baisses ou des tendances dans vos données.

  2. Utilisation d’Amazon CloudWatch : utilisez Amazon CloudWatch pour bénéficier d’une vue centralisée et d’une analyse approfondie.

    1. Configurez des tableaux de bord CloudWatch pour visualiser vos métriques et les comparer au fil du temps.

    2. Utilisez les percentiles dans CloudWatch pour obtenir une vue claire de la distribution des mesures, ce qui peut aider à définir les SLA et à comprendre les valeurs aberrantes.

    3. Configurez la détection d’anomalies CloudWatch pour identifier des modèles inhabituels sans dépendre de seuils statiques.

    4. Mettre en œuvre l’observabilité inter-comptes de CloudWatch pour surveiller et dépanner les applications qui couvrent plusieurs comptes au sein d’une région.

    5. Utilisez CloudWatch Metric Insights pour interroger et analyser les données métriques à travers les comptes et les régions, en identifiant les tendances et les anomalies.

    6. Appliquez CloudWatch Metric Math pour transformer, agréger ou effectuer des calculs sur vos mesures afin d’obtenir des informations plus approfondies.

  3. Emploi d’Amazon DevOps Guru : incorporez Amazon DevOps Guru pour sa détection des anomalies améliorée par le machine learning afin d’identifier les premiers signes de problèmes opérationnels pour vos applications sans serveur et de les résoudre avant qu’ils n’affectent vos clients.

  4. Optimisation sur la base des informations recueillies : prenez des décisions éclairées grâce à l’analyse de vos métriques afin d’ajuster et d’améliorer vos charges de travail.

Niveau d’effort du plan d’implémentation : moyen

Ressources

Bonnes pratiques associées :

Documents connexes :

Vidéos connexes :

Exemples connexes :