Principes de conception - AWS Well-Architected Framework

Principes de conception

Voici les principes de conception pour l’excellence opérationnelle dans le cloud :

  • Exécuter les opérations sous la forme de code : dans le cloud, vous pouvez appliquer la même discipline d'ingénierie que celle que vous utilisez pour le code d'application dans l'ensemble de l'environnement. Vous pouvez définir l'ensemble de votre charge de travail (applications, infrastructure, etc.) en tant que code et la mettre à jour avec du code. Vous pouvez créer des scripts pour vos procédures opératoires et automatiser leur exécution en les lançant en réponse à des événements. En effectuant les opérations en tant que code, vous limitez les erreurs humaines et créez des réponses cohérentes aux événements.

  • Effectuer des modifications fréquentes, mineures et réversibles : concevez des charges de travail évolutives et couplées faiblement pour permettre la mise à jour régulière des composants. Les techniques de déploiement automatisé associées à des modifications mineures et incrémentielles réduisent le rayon d'impact et permettent de faire marche arrière plus rapidement en cas de problème. Cela renforce la confiance dans la possibilité d'apporter des modifications positives à votre charge de travail tout en maintenant la qualité et en s'adaptant rapidement à l'évolution des conditions du marché.

  • Affiner régulièrement les procédures opérationnelles : au fur et à mesure que vos charges de travail évoluent, faites évoluer vos opérations en conséquence. Tout en utilisant des procédures opérationnelles, cherchez le moyen de les améliorer. Passez régulièrement en revue les procédures et assurez-vous qu'elles sont efficaces et maîtrisées par les équipes. Lorsque des lacunes sont identifiées, actualisez les procédures en conséquence. Communiquez les mises à jour des procédures à toutes les parties prenantes et équipes. Transformez vos opérations en jeu pour partager les bonnes pratiques et former les équipes.

  • Anticiper les pannes : par exemple, effectuez des exercices « pre-mortem » afin d'identifier les causes possibles de défaillances, et ainsi les éliminer ou les atténuer. Testez vos scénarios de pannes et confirmez votre compréhension de leur impact. Testez vos procédures de réponse pour vous assurer qu'elles sont efficaces et que les équipes sont familiarisées avec leur exécution. Planifiez des simulations de pannes pour tester les réponses des charges de travail et de l'équipe face à des événements simulés.

  • Tirer des leçons de toutes les pannes opérationnelles : visez l'amélioration grâce aux leçons apprises de tous les événements et pannes liés aux opérations. Communiquez ce qui a été appris aux équipes et à l'ensemble de l'entreprise.

  • Utiliser des services gérés : réduisez la charge opérationnelle en utilisant des services AWS gérés dans la mesure du possible. Élaborez des procédures opérationnelles autour des interactions avec ces services.

  • Mettre en œuvre l'observabilité pour obtenir des informations exploitables : faites-vous une idée précise du comportement, des performances, de la fiabilité, des coûts et de l'état de la charge de travail. Établissez des indicateurs de performance clés (KPI) et tirez parti de la télémétrie de l'observabilité pour prendre des décisions éclairées et agir rapidement lorsque les résultats de l'entreprise sont menacés. Améliorez de manière proactive les performances, la fiabilité et les coûts sur la base de données d'observabilité exploitables.