OPS09-BP02 Communication de l'état et des tendances pour garantir la visibilité des opérations - AWS Well-Architected Framework

OPS09-BP02 Communication de l'état et des tendances pour garantir la visibilité des opérations

Connaître l'état de vos opérations et leurs tendances est nécessaire pour identifier les cas où les résultats peuvent être menacés, pour déterminer si des efforts supplémentaires sont justifiés ou non, ou pour identifier les effets des modifications sur vos équipes. Lors d'événements opérationnels, le fait de disposer de pages d'état auxquelles les utilisateurs et les équipes opérationnelles peuvent se référer pour obtenir des informations contribue à réduire la pression sur les canaux de communication et à diffuser les informations de manière proactive.

Résultat souhaité :

  • Les responsables des opérations ont un aperçu rapide des volumes d'appels auxquels leurs équipes sont confrontées et des initiatives en cours, telles que les déploiements.

  • Des alertes sont diffusées aux parties prenantes et aux communautés d'utilisateurs lorsque des répercussions sur les opérations normales se produisent.

  • La direction de l'organisation et les parties prenantes peuvent consulter une page d'état en réponse à une alerte ou à un impact, et obtenir des informations concernant un événement opérationnel, telles que les points de contact, des informations sur les demandes d'assistance et les délais de reprise estimés.

  • Des rapports sont mis à la disposition de la direction et des autres parties prenantes pour présenter des statistiques opérationnelles telles que le volume d'appels sur une période donnée, les scores de satisfaction des utilisateurs, le nombre de demandes d'assistance en attente et leur ancienneté.

Anti-modèles courants :

  • Une charge de travail tombe en panne, ce qui rend un service indisponible. Le volume d'appels augmente lorsque les utilisateurs demandent à savoir ce qui se passe. Les responsables ajoutent au volume en demandant à savoir qui est à l'origine du problème. Les différentes équipes opérationnelles redoublent leurs efforts pour tenter d'identifier la cause première.

  • Pour répondre à un nouveau besoin, plusieurs membres du personnel sont réaffectés à un effort d'ingénierie. Les postes vacants ne sont pas pourvus, et les délais de résolution des problèmes augmentent. Ces informations ne sont pas capturées, et ce n'est qu'après plusieurs semaines et après avoir reçu des commentaires insatisfaits des utilisateurs que les dirigeants prennent conscience du problème.

Avantages liés au respect de cette bonne pratique : Lors d'événements opérationnels affectant l'entreprise, beaucoup de temps et d'énergie peuvent être gaspillés à demander des informations aux différentes équipes qui tentent de comprendre la situation. En mettant en place des pages d'état et des tableaux de bord largement diffusés, les parties prenantes peuvent rapidement se procurer les informations nécessaires et déterminer, par exemple, si un problème a été détecté ou non, qui est responsable du problème ou quand un retour à une activité normale est attendu. Cela évite aux membres de l'équipe d'avoir à passer trop de temps à communiquer la situation aux autres. Ils peuvent ainsi consacrer plus de temps à la résolution des problèmes.

Niveau d'exposition au risque si cette bonne pratique n'est pas respectée : Moyen

Directives d'implémentation

Créez des tableaux de bord qui présentent les métriques clés actuelles pour vos équipes opérationnelles et mettez-les à disposition des responsables des opérations et de la direction.

Créez des pages d'état qui peuvent être mises à jour rapidement pour indiquer quand un incident ou un événement se produit, qui en est le responsable et qui coordonne la réponse. Partagez sur cette page les étapes ou les solutions que les utilisateurs doivent envisager et diffusez largement son emplacement. Encouragez les utilisateurs à vérifier d'abord cet emplacement lorsqu'ils sont confrontés à un problème inconnu.

Collectez et fournissez des rapports qui présentent l'état des opérations au fil du temps, et distribuez-les aux dirigeants et aux décideurs pour illustrer le travail des opérations ainsi que les défis et les besoins.

Partagez entre les équipes les métriques et rapports qui reflètent au mieux les objectifs et les KPI, ainsi que les domaines où ils ont contribué au changement. Consacrez du temps à ces activités afin de renforcer l'importance des opérations au sein des équipes et entre elles.

Ressources

Documents connexes :

Solutions associées :