Restauration automatique simplifiée basée sur la configuration de l’instance Restauration basée sur CloudWatch l'action Amazon Résoudre les défaillances de récupération d’instance

Récupération de votre instance

Pour récupérer automatiquement une instance en cas d'échec de la vérification de l'état du système, vous pouvez utiliser la configuration par défaut de l'instance ou créer une CloudWatch alarme Amazon. Si une instance est dégradée à cause d’une défaillance matérielle sous-jacente ou à un problème nécessitant une intervention d’ AWS pour sa résolution, l’instance est automatiquement récupérée.

Une instance récupérée est identique à l’instance d’origine, y compris pour l’ID d’instance, les adresses IP privées, les adresses IP Elastic et toutes les métadonnées de l’instance. Si votre instance dégradée a une adresse IPv4 publique, elle conserve la même adresse IPv4 publique après la récupération. Si l’instance dégradée se trouve dans un groupe de placement, l’instance récupérée s’exécute dans le groupe de placement. Lors de la récupération d’instance, l’instance est migrée dans le cadre d’un redémarrage d’instance, et toutes les données en mémoire sont perdues.

Voici quelques exemples de problèmes nécessitant une restauration d’instance :

Perte de connectivité réseau
Perte d’alimentation système
Problèmes logiciels sur un hôte physique
Problèmes matériels sur un hôte physique ayant un impact sur l’accessibilité du réseau

Rubriques

Restauration automatique simplifiée basée sur la configuration de l’instance
Restauration basée sur CloudWatch l'action Amazon
Résoudre les défaillances de récupération d’instance

Restauration automatique simplifiée basée sur la configuration de l’instance

Les instances prenant en charge la restauration automatique simplifiée sont configurées par défaut pour récupérer une instance ayant échoué. La configuration par défaut s’applique aux nouvelles instances que vous lancez et aux instances existantes que vous avez précédemment lancées. La restauration automatique simplifiée est lancée en réponse aux échecs de la vérification de l’état du système. La restauration automatique simplifiée n’a pas lieu pendant les événements Service Health Dashboard (tableau de bord de service d’état) ou tout autre événement ayant une incidence sur le matériel sous-jacent. Pour plus d’informations, consultez Résoudre les défaillances de récupération d’instance.

Lorsqu’un événement de récupération automatique simplifié réussit, vous êtes averti par un événement de Tableau de bord AWS Health . Lorsqu’un événement de récupération automatique simplifié échoue, vous êtes averti par un événement de Tableau de bord AWS Health et par e-mail. Vous pouvez également utiliser EventBridge les règles Amazon pour surveiller les événements de restauration automatique simplifiés à l'aide des codes d'événement suivants :

AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS – événements réussis
AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE – événements échoués

Pour plus d'informations, consultez les EventBridge règles d'Amazon.

Prérequis

La récupération automatique simplifiée est prise en charge par une instance présentant les caractéristiques suivantes :

Elle utilise une location d’instance default ou dedicated
Elle n’utilise pas d’Elastic Fabric Adaptor (adaptateur en tissu élastique).
Elle utilise l’un des types d’instance suivants :
- Usage général : A1 | M3 | M4 | M5 | M5a | M5n | M5zn | M6a | M6g | M6i | M6in | M7a | M7g | M7i | M7i-flex | T1 | T2 | T3 | T3a | T4g
- Optimisés pour le calcul : C3 | C4 | C5 | C5a | C5n | C6a | C6g | C6gn | C6i | C6in | C7a | C7g | C7gn | C7i
- Optimisées pour la mémoire : R3 | R4 | R5 | R5a | R5b | R5n | R6a | R6g | R6i | R6in | R7a | R7g | R7i | R7iz | u-3tb1 | u-6tb1 | u-9tb1 | u-12tb1 | u-18tb1 | u-24tb1 | X1 | X1e | X2iezn
- Calcul accéléré : G3 | G3s | G5g | Inf1 | P2 | P3 | VT1
- Calcul haute performance Hpc6a | Hpc7a | Hpc7g
Elle ne possède pas de volumes de stockage d’instances. Si un type d’instance Nitro possède des volumes de stockage d’instance ou si une instance basée sur Xen possède des volumes de stockage d’instance mappés dans l’AMI en cours d’utilisation, l’instance ne sera pas automatiquement restaurée.

Important
Si des volumes de stockage d’instance sont attachés à une instance, l’arrêt et le démarrage de l’instance entraîneront la perte de toutes les données sur les volumes de stockage d’instance. Vous devez régulièrement sauvegarder les données de volume de votre stockage d’instance vers un stockage plus persistant comme Amazon EBS, Amazon S3 ou Amazon EFS. En cas d’échec de la vérification de l’état du système, vous pouvez arrêter et démarrer des instances avec des volumes de stockage d’instance, puis restaurer les volumes de stockage d’instance à l’aide des données sauvegardées.

Limites

Les instances avec des volumes de stockage d’instances et des types d’instances métalliques ne sont pas prises en charge par une restauration automatique simplifiée.
La restauration automatique simplifiée n’est pas lancée pour les instances d’un groupe Auto Scaling. Si votre instance fait partie d’un groupe Auto Scaling avec des surveillances de l’état activées, elle est remplacée lorsqu’elle est endommagée.
La restauration automatique simplifiée s’applique uniquement aux événements non planifiés. Elle ne s’applique pas aux événements planifiés.
Les instances résiliées ou arrêtées ne peuvent pas être récupérées.

Définir le comportement de restauration

Vous pouvez définir le comportement de restauration automatique sur disabled ou default après le lancement de l’instance. La configuration par défaut n’autorise pas la restauration automatique simplifiée pour un type d’instance non pris en charge.

Console

Pour désactiver la récupération automatique simplifiée lors du lancement de l’instance

Ouvrez la console Amazon EC2 à l’adresse https://console.aws.amazon.com/ec2/.
Dans le panneau de navigation, choisissez Instances, puis Launch instance (Lancer une instance).
Dans la section Advanced details (Détails avancés), pour nstance auto-recovery (Récupération automatique de l’instance), sélectionnez Disabled (Désactivé).
Configurez les paramètres de lancement de l’instance restants selon les besoins, puis lancez l’instance.

Désactivation de la récupération automatique simplifiée d’une instance en cours d’exécution ou arrêtée

Ouvrez la console Amazon EC2 à l’adresse https://console.aws.amazon.com/ec2/.
Dans le panneau de navigation, sélectionnez Instances.
Sélectionnez l’instance, puis choisissez Actions, Instance Settings (Paramètres de l’instance), Change auto-recovery Behavior (Changer le comportement de restauration automatique).
Choisissez Off (Désactiver), puis Save (Enregistrer).

Pour définir le comportement de récupération automatique sur `default` pour une instance en cours d’exécution ou arrêtée

Ouvrez la console Amazon EC2 à l’adresse https://console.aws.amazon.com/ec2/.
Dans le panneau de navigation, sélectionnez Instances.
Sélectionnez l’instance, puis choisissez Actions, Instance Settings (Paramètres de l’instance), Change auto-recovery Behavior (Changer le comportement de restauration automatique).
Choisissez Par défaut (Activé), puis Enregistrer.

AWS CLI

Désactivation de la récupération automatique simplifiée au lancement

Utilisez la commande run-instances.


aws ec2 run-instances \
--image-id ami-1a2b3c4d \
--instance-type t2.micro \
--key-name MyKeyPair \
--maintenance-options AutoRecovery=Disabled \
  [...]

Désactivation de la récupération automatique simplifiée d’une instance en cours d’exécution ou arrêtée

Utilisez la commande modify-instance-maintenance-options.


aws ec2 modify-instance-maintenance-options \
--instance-id i-0abcdef1234567890 \
--auto-recovery disabled

Pour définir le comportement de récupération automatique sur `default` pour une instance en cours d’exécution ou arrêtée

Utilisez la commande modify-instance-maintenance-options.


aws ec2 modify-instance-maintenance-options \
--instance-id i-0abcdef1234567890 \
--auto-recovery default

Restauration basée sur CloudWatch l'action Amazon

Utilisez Amazon CloudWatch Action Based Recovery si vous souhaitez personnaliser le moment de restauration de votre instance.

Lorsque l’alarme StatusCheckFailed_System est déclenchée et que l’action de récupération est initiée, vous serez averti par la rubrique Amazon SNS que vous avez sélectionnée quand vous avez créé l’alarme et associé l’action de récupération. Lorsque l’action de récupération est terminée, les informations sont publiées dans la rubrique Amazon SNS que vous avez configurée pour l’alarme. Toutes les personnes abonnées à cette rubrique Amazon SNS reçoivent une notification par e-mail qui inclut le statut de la tentative de récupération et les éventuelles instructions supplémentaires. Lors de la dernière étape de l’action de récupération, l’instance récupérée redémarre.

Vous pouvez utiliser les CloudWatch alarmes Amazon pour récupérer une instance même si la restauration automatique simplifiée n'est pas désactivée. Pour plus d'informations sur la création d'une CloudWatch alarme Amazon pour récupérer une instance, consultezAjouter des actions de restauration aux CloudWatch alarmes Amazon.

Types d’instance pris en charge

Tous les types d'instances pris en charge par la restauration automatique simplifiée sont également pris en charge par la restauration basée sur CloudWatch l'action Amazon. En outre, la restauration basée sur l' CloudWatch action prend en charge les variantes bare metal des types d'instances pris en charge. Les familles d’instances suivantes sont également prises en charge en plus de celles prises en charge par la restauration automatique simplifiée :

Mémoire optimisée : X2idn | X2iedn

Important

Pour les types d’instances pris en charge dotés de volumes de stockage d’instances, toutes les données présentes sur ces volumes seront perdues lors d’une restauration. L’arrêt et le démarrage de l’instance entraîneront également la perte de toutes les données du volume de stockage d’instances. Vous devez régulièrement sauvegarder les données de volume de votre stockage d’instance vers un stockage plus persistant comme Amazon EBS, Amazon S3 ou Amazon EFS. En cas d’échec de la vérification de l’état du système, vous pouvez arrêter et démarrer des instances avec des volumes de stockage d’instance, puis restaurer les volumes de stockage d’instance à l’aide des données sauvegardées.

CloudWatch la restauration basée sur l'action ne prend pas en charge la restauration pour les instances dotées d'une location d'hôte dédié. Pour les hôtes dédiés Amazon EC2, vous pouvez utiliser récupération automatique de l’hôte dédié pour récupérer automatiquement les instances défectueuses.

Vous pouvez utiliser le AWS Management Console ou AWS CLI pour afficher les types d'instances qui prennent en charge la restauration basée sur CloudWatch l'action.

Résoudre les défaillances de récupération d’instance

Les problèmes suivants peuvent causer l’échec de la récupération de votre instance :

Lors d’événements du Service Health Dashboard, la récupération automatique simplifiée peut ne pas récupérer votre instance. Il se peut que vous ne receviez pas de notifications d’échec de récupération pour de tels événements. Tout événement Service Health Dashboard en cours peut également empêcher la restauration basée sur l' CloudWatch action de récupérer correctement une instance. Pour obtenir les dernières informations sur la disponibilité des services, consultez http://status.aws.amazon.com/.
Capacité temporaire, insuffisante du matériel de remplacement.
L’instance a atteint l’autorisation quotidienne maximale de trois tentatives de récupération.

Le processus de récupération automatique tente de récupérer votre instance pour trois défaillances distinctes par jour au maximum. Si l’échec du contrôle de statut du système d’instance persiste, nous vous recommandons d’arrêter et de démarrer manuellement l’instance. Les données sur les volumes de stockage d’instances sont perdues lorsque l’instance est arrêtée. Pour plus d’informations, consultez Arrêtez et démarrez les instances Amazon EC2.

Votre instance pourrait ensuite être retirée si la récupération automatique échoue et si une dégradation matérielle est la cause première de l’échec du contrôle de statut du système d’origine.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Mise hors service

Connexion

Récupération de votre instance

Rubriques

Restauration automatique simplifiée basée sur la configuration de l’instance

Rubriques

Prérequis

Important

Limites

Définir le comportement de restauration

Pour désactiver la récupération automatique simplifiée lors du lancement de l’instance

Désactivation de la récupération automatique simplifiée d’une instance en cours d’exécution ou arrêtée

Pour définir le comportement de récupération automatique sur `default` pour une instance en cours d’exécution ou arrêtée

Désactivation de la récupération automatique simplifiée au lancement

Désactivation de la récupération automatique simplifiée d’une instance en cours d’exécution ou arrêtée

Pour définir le comportement de récupération automatique sur `default` pour une instance en cours d’exécution ou arrêtée

Restauration basée sur CloudWatch l'action Amazon

Types d’instance pris en charge

Important

Pour voir les types d'instances qui prennent en charge la restauration basée sur CloudWatch l'action d'Amazon

Pour voir les types d'instances qui prennent en charge la restauration basée sur CloudWatch l'action d'Amazon

Résoudre les défaillances de récupération d’instance

Récupération de votre instance

Rubriques

Restauration automatique simplifiée basée sur la configuration de l’instance

Rubriques

Prérequis

Important

Limites

Définir le comportement de restauration

Pour désactiver la récupération automatique simplifiée lors du lancement de l’instance

Désactivation de la récupération automatique simplifiée d’une instance en cours d’exécution ou arrêtée

Pour définir le comportement de récupération automatique sur default pour une instance en cours d’exécution ou arrêtée

Désactivation de la récupération automatique simplifiée au lancement

Désactivation de la récupération automatique simplifiée d’une instance en cours d’exécution ou arrêtée

Pour définir le comportement de récupération automatique sur default pour une instance en cours d’exécution ou arrêtée

Restauration basée sur CloudWatch l'action Amazon

Types d’instance pris en charge

Important

Pour voir les types d'instances qui prennent en charge la restauration basée sur CloudWatch l'action d'Amazon

Pour voir les types d'instances qui prennent en charge la restauration basée sur CloudWatch l'action d'Amazon

Résoudre les défaillances de récupération d’instance

Pour définir le comportement de récupération automatique sur `default` pour une instance en cours d’exécution ou arrêtée

Pour définir le comportement de récupération automatique sur `default` pour une instance en cours d’exécution ou arrêtée