Principes de conception

Voici les principes de conception pour l’excellence opérationnelle dans le cloud :

Organiser les équipes en fonction des résultats commerciaux : la capacité d’une équipe à atteindre les résultats commerciaux découle de la vision des dirigeants, de l’efficacité des opérations et d’un modèle opérationnel adapté aux besoins de l’entreprise. Les dirigeants doivent être pleinement investis et engagés dans la transformation des opérations dans le cloud (CloudOps) avec un modèle d’exploitation cloud adapté qui encourage les équipes à travailler de la manière la plus efficace possible et à atteindre les résultats commerciaux. Le bon modèle d’exploitation utilise les ressources humaines, les processus et les capacités technologiques pour évoluer, optimiser la productivité et se différencier grâce à l’agilité, à la réactivité et à l’adaptation. La vision à long terme de l’organisation se traduit par des objectifs qui sont communiqués au sein de l’entreprise aux parties prenantes et aux consommateurs de vos services cloud. Les objectifs et les indicateurs de performance clés (KPI) opérationnels sont harmonisés à tous les niveaux. Cette pratique maintient la valeur à long terme dérivée de la mise en œuvre des principes de conception suivants.
Mettre en œuvre l’observabilité pour obtenir des informations exploitables : faites-vous une idée précise du comportement, des performances, de la fiabilité, des coûts et de l’état de la charge de travail. Établissez des indicateurs de performance clés (KPI) et tirez parti de la télémétrie de l’observabilité pour prendre des décisions éclairées et agir rapidement lorsque les résultats de l’entreprise sont menacés. Améliorez de manière proactive les performances, la fiabilité et les coûts sur la base de données d’observabilité exploitables.
Automatiser les opérations en toute sécurité autant que possible : dans le cloud, vous pouvez appliquer la même discipline d’ingénierie que celle que vous utilisez pour le code d’application dans l’ensemble de votre environnement. Vous pouvez définir l’ensemble de votre charge de travail et de ses opérations (applications, infrastructure, configuration et procédures) sous forme de code et les mettre à jour. Vous pouvez ensuite automatiser les opérations de votre charge de travail en les lançant en réponse à des événements. Dans le cloud, vous pouvez utiliser la sécurité de l’automatisation en configurant des barrières de protection, notamment le contrôle du débit, les seuils d’erreur et les approbations. Grâce à une automatisation efficace, vous pouvez obtenir des réponses cohérentes aux événements, limiter les erreurs humaines et réduire la charge de travail des opérateurs.
Effectuer des modifications fréquentes, mineures et réversibles : concevez des charges de travail évolutives et faiblement couplées pour permettre la mise à jour régulière des composants. Les techniques de déploiement automatisé associées à des modifications mineures et incrémentielles réduisent le rayon d’impact et permettent de faire marche arrière plus rapidement en cas de problème. Cela renforce la confiance dans la possibilité d’apporter des modifications positives à votre charge de travail tout en maintenant la qualité et en s’adaptant rapidement à l’évolution des conditions du marché.
Affiner régulièrement les procédures opérationnelles : au fur et à mesure que vos charges de travail évoluent, faites évoluer vos opérations en conséquence. Tout en utilisant des procédures opérationnelles, cherchez le moyen de les améliorer. Passez régulièrement en revue les procédures et assurez-vous qu’elles sont efficaces et maîtrisées par les équipes. Lorsque des lacunes sont identifiées, actualisez les procédures en conséquence. Communiquez les mises à jour des procédures à toutes les parties prenantes et équipes. Transformez vos opérations en jeu pour partager les bonnes pratiques et former les équipes.
Anticiper les défaillances : optimisez la réussite opérationnelle en élaborant des scénarios de défaillance afin de comprendre le profil de risque de la charge de travail et son impact sur les résultats de votre entreprise. Testez l’efficacité de vos procédures et la réponse de votre équipe face à ces défaillances simulées. Prenez des décisions éclairées pour gérer les risques ouverts identifiés lors de vos tests.
Tirer des leçons de tous les événements et métriques opérationnels : visez l’amélioration grâce aux leçons tirées de tous les événements opérationnels et des défaillances liées aux opérations. Communiquez ce qui a été appris aux équipes et à l’ensemble de l’entreprise. Les enseignements tirés devraient mettre en lumière des données et des anecdotes sur la façon dont les opérations contribuent aux résultats commerciaux.
Utiliser des services gérés : réduisez la charge opérationnelle en utilisant des services AWS gérés dans la mesure du possible. Élaborez des procédures opérationnelles autour des interactions avec ces services.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Excellence opérationnelle

Définition