Procédures d'exploitation normalisées - AWS Hub de Résilience

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Procédures d'exploitation normalisées

Une procédure d'exploitation standard (SOP) est un ensemble d'étapes normatives conçues pour récupérer efficacement votre application en cas de panne ou d'alarme. Préparez, testez et mesurez vos SOP à l'avance pour assurer une récupération rapide en cas de panne opérationnelle.

En fonction des composants de votre application,AWS Resilience Hubrecommande les SOP que vous devez préparer.AWS Resilience Hubtravaille avec Systems Manager pour automatiser les étapes de vos SOP en fournissant un certain nombre de documents SSM que vous pouvez utiliser comme base pour ces SOP.

Par exemple,AWS Resilience Hubpeut recommander une SOP pour ajouter de l'espace disque basé sur un document SSM Automation existant. Pour exécuter ce document SSM, vous devez disposer d'un rôle IAM spécifique avec les autorisations appropriées.AWS Resilience Hubcrée des métadonnées dans votre application indiquant quel document d'automatisation SSM exécuter en cas de pénurie de disque et quel rôle IAM est requis pour exécuter ce document SSM. Ces métadonnées sont ensuite enregistrées dans un paramètre SSM.

En plus de configurer l'automatisation SSM, il est également recommandé de le tester avec une expérience de service d'injection de défauts (FIS). Par conséquent,AWS Resilience Hubfournit également une expérience FIS qui appelle le document d'automatisation SSM. De cette façon, vous pouvez tester proactivement votre application pour vous assurer que le SOP que vous avez créé effectue le travail prévu.

AWS Resilience Hubfournit ses recommandations sous la forme d'unAWS CloudFormationmodèle que vous pouvez ajouter à votre base de code d'application. Ce modèle fournit les éléments suivants :

  • Le rôle IAM avec les autorisations requises pour exécuter le SOP

  • Une expérience FIS que vous pouvez utiliser pour tester les SOP

  • Paramètre SSM qui contient des métadonnées d'application indiquant quel document SSM et quel rôle IAM doit être exécuté en tant que SOP et sur quelle ressource. Par exemple : $(DocumentName) for SOP $(HandleCrisisA) on $(ResourceA).

La création d'un SOP peut nécessiter des essais et des erreurs. Exécution d'une évaluation de la résilience par rapport à votre application et génération d'unAWS CloudFormationà partir duAWS Resilience Hubles recommandations sont un bon début. Utilisation de l'AWS CloudFormationmodèle pour générer unAWS CloudFormation, puis utilisez les paramètres SSM et leurs valeurs par défaut dans votre SOP. Exécutez le SOP et découvrez les améliorations que vous devez apporter.

Étant donné que toutes les applications ont des exigences différentes, la liste par défaut des documents SSM quiAWS Resilience Hubles prestations ne seront pas suffisantes pour tous vos besoins. Vous pouvez cependant copier les documents SSM par défaut et les utiliser comme base pour créer vos propres documents personnalisés adaptés à votre application. Vous pouvez également créer vos propres documents SSM entièrement nouveaux. Si vous créez vos propres documents SSM au lieu de modifier les valeurs par défaut, vous devez les associer à des paramètres SSM, de sorte que le document SSM approprié est appelé lors de l'exécution de la SOP.

Lorsque vous avez finalisé votre SOP en créant les documents SSM nécessaires et en mettant à jour les associations de paramètres et de documents, le cas échéant, ajoutez les documents SSM directement à votre base de code et effectuez les modifications ou personnalisations ultérieures. De cette façon, chaque fois que vous déployez votre application, vous déploierez également le SOP le plus récent.