Qu'est-ce qu'AWS Incident Detection and Response ? - AWSGuide de l'utilisateur sur la détection et la réponse aux incidents

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Qu'est-ce qu'AWS Incident Detection and Response ?

AWS Incident Detection and Response offre aux clients éligibles du support aux AWS entreprises éligibles un engagement proactif en cas d'incident afin de réduire les risques de défaillance et d'accélérer le rétablissement des charges de travail critiques après une interruption. La détection et la réponse aux incidents facilitent votre collaboration AWS pour développer des runbooks et des plans de réponse personnalisés en fonction de chaque charge de travail intégrée. Une équipe d'ingénieurs de gestion des incidents (IME) surveille vos charges de travail intégrées 24 heures sur 24, 7 jours sur 7 et vous met en contact avec un pont d'appels dans les 5 minutes suivant une alarme critique.

La détection et la réponse aux incidents offrent les fonctionnalités clés suivantes :

  • Observabilité améliorée : des AWS experts fournissent des conseils pour vous aider à définir et à corréler les métriques et les alarmes entre les couches d'application et d'infrastructure de votre charge de travail afin de détecter les perturbations à un stade précoce.

  • Temps de réponse de 5 minutes : les IME surveillent vos charges de travail intégrées 24 heures sur 24, 7 jours sur 7 pour détecter les incidents critiques. Les IME répondent dans les 5 minutes suivant le déclenchement d'une alarme ou en réponse à un dossier de Support critique que vous soumettez à la section Détection et réponse aux incidents.

  • Résolution plus rapide : les IME utilisent des runbooks prédéfinis et personnalisés développés pour vos charges de travail afin de répondre dans les 5 minutes, de créer un dossier de support en votre nom et de gérer les incidents liés à votre charge de travail. Les IME permettent de gérer les incidents de manière centralisée et vous permettent de rester en contact avec les bons AWS experts jusqu'à ce que l'incident soit résolu.

  • Gestion des incidents liés aux AWS événements : Parce que nous comprenons le contexte de votre charge de travail critique (par exemple, les comptes, les services et les instances), nous pouvons détecter et vous informer de manière proactive d'un impact potentiel sur votre charge de travail lors d'un événement de AWS service. Sur demande, les IME vous contactent lors des événements AWS de service et fournissent des mises à jour sur les événements. Bien que la détection et la réponse aux incidents ne puissent pas vous donner la priorité en matière de restauration lors d'un événement de service, Incident Detection and Response fournit des conseils de support pour vous aider à mettre en œuvre votre plan d'atténuation.

  • Risque de défaillance réduit : après résolution, les IME vous fournissent un examen post-incident (sur demande). De plus, des AWS experts travaillent avec vous pour appliquer les leçons apprises afin d'améliorer le plan de réponse aux incidents et les livrets d'exécution. Vous pouvez également tirer parti AWS Resilience Hub du suivi continu de la résilience de vos charges de travail.