Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
AWS Resilience Hub concepts
Ces concepts peuvent vous aider à mieux comprendre AWS Resilience Hub l'approche adoptée pour améliorer la résilience des applications et prévenir les pannes d'applications.
Résilience
La capacité de maintenir la disponibilité et de récupérer après une interruption logicielle ou opérationnelle dans un laps de temps défini.
Objectif du point de récupération (RPO)
Durée maximale acceptable depuis le dernier point de récupération des données. Il détermine ce qui est considéré comme étant une perte de données acceptable entre le dernier point de reprise et l’interruption du service.
Objectif en matière de temps de rétablissement (RTO)
Le délai maximum acceptable entre l'interruption du service et le rétablissement du service. Elle détermine ce qui est considéré comme étant un créneau de temps acceptable d’indisponibilité du service.
Objectif de temps de rétablissement de la charge de travail estimé
L'objectif de temps de reprise de la charge de travail estimé (charge de travail estiméeRTO) est RTO celui que votre application est censée atteindre sur la base de la définition de l'application importée, puis de l'exécution d'une évaluation.
Objectif estimé du point de rétablissement de la charge de travail
L'objectif du point de reprise de la charge de travail estimé (charge de travail estiméeRPO) est RPO celui que votre application est censée atteindre en fonction de la définition de l'application importée, puis de l'exécution d'une évaluation.
Application
Une AWS Resilience Hub application est un ensemble de ressources AWS prises en charge qui sont surveillées et évaluées en permanence pour gérer sa posture de résilience.
Composant de l'application
Un groupe de AWS ressources connexes qui fonctionnent et échouent en tant qu'unité unique. Par exemple, si vous avez une base de données principale et une base de données répliquée, les deux bases de données appartiennent au même composant d'application (AppComponent).
AWS Resilience Hub détermine quelles AWS ressources peuvent appartenir à quel type de AppComponent. Par exemple, un DBInstance
peut appartenir à AWS::ResilienceHub::DatabaseAppComponent
mais pas àAWS::ResilienceHub::ComputeAppComponent
.
État de conformité de l'application
AWS Resilience Hub indique les types d'état de conformité suivants pour vos applications.
Politique respectée
On estime que l'application atteindra ses RPO objectifs RTO et ceux définis dans la politique. Tous ses composants répondent aux objectifs politiques définis. Par exemple, vous avez sélectionné un RPO objectif RTO de 24 heures pour les interruptions dans toutes les AWS régions. AWS Resilience Hub peut voir que vos sauvegardes sont copiées dans votre région de secours. Vous êtes toujours tenu de maintenir une restauration à partir d'une procédure d'exploitation standard de sauvegarde (SOP), de la tester et de la chronométrer. Cela figure dans les recommandations opérationnelles et fait partie de votre score de résilience global.
Politique violée
Il n'a pas été possible d'estimer que l'application RTO atteindra les RPO objectifs définis dans la politique. Un ou plusieurs d'entre eux AppComponents ne répondent pas aux objectifs de la politique. Par exemple, vous avez sélectionné un RTO RPO objectif de 24 heures pour les interruptions entre les AWS régions, mais la configuration de votre base de données n'inclut aucune méthode de restauration entre régions, telle qu'une réplication globale et des copies de sauvegarde.
Non évalué
La demande nécessite une évaluation. Il n'est actuellement ni évalué ni suivi.
Changements détectés
Il existe une nouvelle version publiée de l'application qui n'a pas encore été évaluée.
Détection des écarts
AWS Resilience Hub exécute une notification de dérive lors de l'exécution d'une évaluation de votre application afin de vérifier si les modifications apportées aux AppComponent configurations ont affecté le statut de conformité de votre application. En outre, il vérifie et détecte les modifications telles que l'ajout ou la suppression de ressources dans les sources d'entrée de l'application et en informe. À des fins de comparaison, AWS Resilience Hub utilise l'évaluation précédente dans laquelle le composant de l'application respectait la politique. AWS Resilience Hub détecte les types de dérives suivants :
-
Déviation de la politique d'application — Ce type de dérive identifie tous AppComponents ceux qui étaient conformes à la politique lors de l'évaluation précédente mais qui ne l'ont pas été lors de l'évaluation actuelle.
-
Dérive des ressources de l'application : ce type de dérive identifie toutes les ressources dérivées dans la version actuelle de l'application.
Évaluation de la résilience
AWS Resilience Hub utilise une liste de lacunes et de solutions potentielles pour mesurer l'efficacité d'une politique sélectionnée en matière de reprise et de poursuite après un sinistre. Il évalue le statut de conformité de chaque composant d'application ou de chaque application à la politique. Ce rapport inclut des recommandations d'optimisation des coûts et des références aux problèmes potentiels.
Score de résilience
AWS Resilience Hub génère un score qui indique dans quelle mesure votre application suit nos recommandations pour respecter la politique de résilience, les alarmes, les procédures opérationnelles standard (SOPs) et les tests de l'application.
Type de perturbation
AWS Resilience Hub vous aide à évaluer la résilience face aux types de pannes suivants :
Application
L'infrastructure est saine, mais l'application ou la pile logicielle ne fonctionne pas comme il se doit. Cela peut se produire après le déploiement d'un nouveau code, des modifications de configuration, une corruption de données ou un dysfonctionnement des dépendances en aval.
Infrastructure cloud
L'infrastructure cloud ne fonctionne pas comme prévu en raison d'une panne. Une panne peut survenir en raison d'une erreur locale dans un ou plusieurs composants. Dans la plupart des cas, ce type de panne est résolu en redémarrant, en recyclant ou en rechargeant les composants défectueux.
Interruption de l'infrastructure cloud AZ
Une ou plusieurs zones de disponibilité ne sont pas disponibles. Ce type de panne peut être résolu en passant à une autre zone de disponibilité.
Incident dans la région d'infrastructure cloud
Une ou plusieurs régions ne sont pas disponibles. Ce type d'incident peut être résolu en passant à un autre Région AWS.
Expériences d'injection de défauts
AWS Resilience Hub recommande des tests pour vérifier la résilience des applications face à différents types de pannes. Ces pannes incluent les applications, l'infrastructure, les zones de disponibilité (AZ) ou les Région AWS incidents liés aux composants de l'application.
Ces expériences vous permettent d'effectuer les opérations suivantes :
-
Injectez un échec.
-
Vérifiez que les alarmes peuvent détecter une panne.
-
Vérifiez que les procédures de restauration, ou procédures opérationnelles standard (SOPs), fonctionnent correctement pour récupérer l'application après une panne.
Tests pour SOPs mesurer la charge de travail estimée RTO et la charge de travail estiméeRPO. Vous pouvez tester différentes configurations d'applications et mesurer si le résultat RTO RPO atteint les objectifs définis dans votre politique.
SOP
Une procédure opérationnelle standard (SOP) est un ensemble prescriptif d'étapes conçues pour restaurer efficacement votre application en cas de panne ou d'alarme. Sur la base de l'évaluation de l'application, AWS Resilience Hub recommande un ensemble de mesures SOPs et il est recommandé de les préparer, de les tester et de SOPs les mesurer avant une interruption afin de garantir une reprise rapide.