REL05-BP07 Mettre en place des leviers d'urgence - AWS Well-Architected Framework

REL05-BP07 Mettre en place des leviers d'urgence

Les leviers d'urgence sont des processus rapides qui peuvent réduire l'impact sur la disponibilité de votre charge de travail.

Les leviers d'urgence fonctionnent en désactivant, en limitant ou en modifiant le comportement des composants ou des dépendances à l'aide de mécanismes connus et testés. Ils permettent d'atténuer les perturbations de la charge de travail causées par l'épuisement des ressources dû à une augmentation inattendue de la demande et de réduire l'impact des défaillances des composants non stratégiques de votre charge de travail.

Résultat souhaité : en mettant en place des leviers d'urgence, vous pouvez établir des processus dont le fonctionnement a été vérifié pour préserver la disponibilité des composants stratégiques de votre charge de travail. La charge de travail devrait se dégrader de manière appropriée et continuer à remplir ses fonctions stratégiques durant l'activation d'un levier d'urgence. Pour plus d'informations sur la dégradation appropriée, consultez REL05-BP01 Implémenter une dégradation appropriée pour transformer les dépendances matérielles applicables en dépendances logicielles.

Anti-modèles courants :

  • La défaillance des dépendances non stratégiques a un impact sur la disponibilité de votre charge de travail principale.

  • Le comportement des composants stratégiques n'est pas testé ou vérifié lors d'une défaillance d'un composant non stratégique.

  • Aucun critère clair et déterministe n'a été défini pour l'activation ou la désactivation d'un levier d'urgence.

Avantages liés au respect de cette bonne pratique : la mise en place de leviers d'urgence peut améliorer la disponibilité des composants stratégiques de votre charge de travail en fournissant à vos résolveurs des processus établis pour répondre à des pics de demande imprévus ou à des défaillances des dépendances non stratégiques.

Niveau de risque exposé si cette bonne pratique n'est pas établie: moyen

Directives d'implémentation

  • Identifier les composants stratégiques de votre charge de travail.

  • Concevoir et construire les composants stratégiques de votre charge de travail de manière à ce qu'ils résistent aux défaillances des composants non stratégiques.

  • Effectuer des tests pour valider le comportement de vos composants stratégiques en cas de défaillance des composants non stratégiques.

  • Définir et surveiller des métriques ou des déclencheurs pertinents pour lancer des procédures de levier d'urgence.

  • Définir les procédures (manuelles ou automatisées) qui comprennent le levier d'urgence.

Étapes d'implémentation

  • Identifier les composants stratégiques de votre charge de travail.

  • Concevoir et construire les composants stratégiques de votre charge de travail de manière à ce qu'ils résistent aux défaillances des composants non stratégiques.

    • Lors de l'analyse des dépendances, tenez compte de tous les modes de défaillance potentiels et vérifiez que vos mécanismes de levier d'urgence fournissent les fonctionnalités stratégiques aux composants en aval.

  • Effectuer des tests pour valider le comportement de vos composants stratégiques pendant l'activation de vos leviers d'urgence.

  • Définir et surveiller des métriques pertinentes pour lancer des procédures de levier d'urgence.

    • La recherche des bonnes métriques à surveiller dépend de votre charge de travail. Parmi les métriques, citons la latence ou le nombre de demandes infructueuses à une dépendance.

  • Définir les procédures (manuelles ou automatisées) qui comprennent le levier d'urgence.

Ressources

Bonnes pratiques associées :

Documents connexes :

Vidéos connexes :