Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Étape 4 : Opérer
Cette étape se concentre sur les pratiques opérationnelles utilisées par votre système pour maintenir et améliorer la résilience. La mise en place d'une culture d'excellence opérationnelle permet d'établir des normes et de garantir la cohérence de ces pratiques.
Observabilité
Pour mesurer efficacement la résilience, surveillez vos applications à la fois du côté serveur et du côté client.
Pour la surveillance côté serveur, utilisez vos outils de surveillance d'infrastructure préférés. À l'aide de ces outils, configurez des tableaux de bord, des alarmes et des notifications en cas de violation des indicateurs de performance clés (KPIs) de l'infrastructure ou des applications. Si vous utilisez Amazon CloudWatch, configurez des tableaux de bord et des alarmes afin de fournir des alertes en cas de défaillance de l'infrastructure ou des applications.
Utilisez les Quotas de Service, Service AWS qui vous aident à gérer vos quotas pour de nombreuses personnes Services AWS. Cela permet d'éviter les problèmes de quotas de service lorsque vous augmentez vos charges de travail de production. AWS Vous pouvez également créer des CloudWatch alarmes qui vous alertent lorsque vous approchez du seuil pour les services essentiels de votre charge de travail.
Pour la surveillance côté client, configurez la surveillance synthétique en créant des scripts ou des canaris qui surveillent les indicateurs de votre application, tels que la disponibilité, le temps de chargement des pages ou les liens rompus. La surveillance synthétique vérifie en permanence l'expérience de vos clients en suivant les mêmes itinéraires et actions que les clients. Vous pouvez utiliser les canaris d'Amazon CloudWatch Synthetics pour surveiller visuellement vos applications. Le plan de surveillance visuelle vous permet de créer ou de mettre à jour rapidement des canaris qui comparent les captures d'écran de votre application en cours d'exécution à la capture d'écran de référence. Vous pouvez également utiliser CloudWatch RUM pour effectuer une surveillance réelle des utilisateurs afin de collecter et de visualiser les données côté client concernant les performances de votre application Web à partir de sessions utilisateur réelles en temps quasi réel. Vous pouvez visualiser et analyser des données, telles que les temps de chargement des pages, les erreurs côté client et le comportement des utilisateurs.
Ressources supplémentaires :
Résilience continue
Passez régulièrement en revue le niveau de résilience de vos charges de travail critiques à l'aide du AWS Well-Architected Tool. Pensez également à organiser une journée de jeu