Détection - Reprise après sinistre des charges de travail sur AWS : restauration dans le cloud

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Détection

Il est important de savoir dès que possible que vos charges de travail ne produisent pas les résultats commerciaux escomptés. Ainsi, vous pouvez rapidement déclarer un sinistre et vous remettre d'un incident. Pour atteindre des objectifs de rétablissement ambitieux, ce temps de réponse associé à des informations appropriées est essentiel pour atteindre les objectifs de rétablissement. Si votre objectif de temps de reprise est d'une heure, vous devez détecter l'incident, informer le personnel approprié, engager vos processus d'escalade, évaluer les informations (si vous en avez) sur le délai de reprise prévu (sans exécuter le plan de reprise après sinistre), déclarer un sinistre et récupérer dans l'heure qui suit.

Note

Si les parties prenantes décident de ne pas invoquer la DR même si le RTO est en danger, réévaluez les plans et objectifs de DR. La décision de ne pas invoquer de plans de reprise après sinistre peut être due à des plans inadéquats ou à un manque de confiance dans leur exécution.

Il est essentiel de tenir compte de la détection, de la notification, de l'escalade, de la découverte et de la déclaration des incidents dans votre planification et vos objectifs afin de fournir des objectifs réalistes et réalisables qui apportent une valeur commerciale.

AWS publie la plupart des up-to-the-minute informations relatives à la disponibilité des services sur le Service Health Dashboard. Renseignez-vous à tout moment pour obtenir des informations sur le statut actuel ou abonnez-vous à un fil RSS pour être informé des interruptions de chaque service individuel. Si vous rencontrez un problème opérationnel en temps réel avec l'un de nos services qui n'apparaît pas sur le Service Health Dashboard, vous pouvez créer une demande de Support.

AWS Health DashboardFournit des informations sur AWS Health les événements susceptibles d'affecter votre compte. Les informations sont présentées de deux manières : un tableau de bord qui montre les événements récents et à venir organisés par catégorie, et un journal des événements complet qui contient tous les événements des 90 derniers jours.

Pour répondre aux exigences RTO les plus strictes, vous pouvez implémenter un basculement automatique basé sur des contrôles de santé. Concevez des bilans de santé représentatifs de l'expérience utilisateur et basés sur des indicateurs de performance clés. Des bilans de santé approfondis mettent en œuvre les fonctionnalités clés de votre charge de travail et vont au-delà de simples contrôles du rythme cardiaque. Utilisez des contrôles de santé approfondis basés sur plusieurs signaux. Faites preuve de prudence en adoptant cette approche afin de ne pas déclencher de fausses alarmes, car le fait de basculer lorsque cela n'est pas nécessaire peut en soi présenter des risques de disponibilité.