Récupération de votre instance - Amazon Elastic Compute Cloud

Récupération de votre instance

Pour restaurer automatiquement une instance lorsqu'un échec de vérification de l'état du système se produit, vous pouvez utiliser la configuration par défaut de l'instance ou créer une alarme Amazon CloudWatch. Si une instance est dégradée à cause d'une défaillance matérielle sous-jacente ou à un problème nécessitant une intervention d'AWS pour sa résolution, l'instance est automatiquement récupérée.

Une instance récupérée est identique à l'instance d'origine, y compris pour l'ID d'instance, les adresses IP privées, les adresses IP Elastic et toutes les métadonnées de l'instance. Si votre instance dégradée a une adresse IPv4 publique, elle conserve la même adresse IPv4 publique après la récupération. Si l'instance dégradée se trouve dans un groupe de placement, l'instance récupérée s'exécute dans le groupe de placement. Lors de la récupération d'instance, l'instance est migrée dans le cadre d'un redémarrage d'instance, et toutes les données en mémoire sont perdues.

Voici quelques exemples de problèmes nécessitant une restauration d'instance :

  • Perte de connectivité réseau

  • Perte d'alimentation système

  • Problèmes logiciels sur un hôte physique

  • Problèmes matériels sur un hôte physique ayant un impact sur l'accessibilité du réseau

Restauration automatique simplifiée basée sur la configuration de l'instance

Les instances prenant en charge la restauration automatique simplifiée sont configurées par défaut pour récupérer une instance ayant échoué. La configuration par défaut s'applique aux nouvelles instances que vous lancez et aux instances existantes que vous avez précédemment lancées. La restauration automatique simplifiée est lancée en réponse aux échecs de la vérification de l'état du système. La restauration automatique simplifiée n'a pas lieu pendant les événements Service Health Dashboard (tableau de bord de service d'état) ou tout autre événement ayant une incidence sur le matériel sous-jacent. Pour de plus amples informations, veuillez consulter Résoudre les défaillances de récupération d'instance.

Lorsqu'un événement de récupération automatique simplifié réussit, vous êtes averti par un événement de Tableau de bord AWS Health. Lorsqu'un événement de récupération automatique simplifié échoue, vous êtes averti par un événement de Tableau de bord AWS Health et par e-mail. Vous pouvez également utiliser les règles Amazon EventBridge pour surveiller les événements de récupération automatique simplifiés à l'aide des codes d'événement suivants :

  • AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS – événements réussis

  • AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE – événements échoués

Pour plus d'informations, consultez la rubrique Règles Amazon EventBridge.

Prérequis

La récupération automatique simplifiée est prise en charge par une instance présentant les caractéristiques suivantes :

  • Elle utilise une location d'instance default ou dedicated

  • Elle n'utilise pas d'Elastic Fabric Adaptor (adaptateur en tissu élastique).

  • Elle utilise l'un des types d'instance suivants :

    • Usage général : M3 | M4 | M5 | M5a | M5n | M5zn | M6a | M6i | M6in | T1 | T2 | T3 | T3a

    • Optimisés pour le calcul : C3 | C4 | C5 | C5a | C5n | C6a | C6i | C6in

    • À mémoire optimisée : R3 | R4 | R5 | R5a | R5b | R5n | R6a | R6g | R6in | u-3tb1 | u-6tb1 | u-9tb1 | u-12tb1 | u-18tb1 | u-24tb1 | X1 | X1e | X2iezn

    • Calcul accéléré : G3 | G3s | P2 | P3

  • Elle ne possède pas de volumes de stockage d'instances. Si un type d'instance Nitro possède des volumes de stockage d'instance ou si une instance basée sur Xen possède des volumes de stockage d'instance mappés, l'instance ne sera pas automatiquement restaurée. Vous devez régulièrement sauvegarder les données de volume de votre stockage d'instance vers un stockage plus persistant comme Amazon EBS, Amazon S3 ou Amazon EFS. En cas d'échec de la vérification de l'état du système, vous pouvez arrêter et démarrer des instances avec des volumes de stockage d'instance, puis restaurer votre volume de stockage d'instance à l'aide des données sauvegardées.

Limites

  • Les instances avec des volumes de stockage d'instances et des types d'instances métalliques ne sont pas prises en charge par une restauration automatique simplifiée.

  • La restauration automatique simplifiée n'est pas lancée pour les instances d'un groupe Auto Scaling. Si votre instance fait partie d'un groupe Auto Scaling avec des surveillances de l'état activées, elle est remplacée lorsqu'elle est endommagée.

  • La restauration automatique simplifiée s'applique uniquement aux événements non planifiés. Elle ne s'applique pas aux événements planifiés.

  • Les instances résiliées ou arrêtées ne peuvent pas être récupérées.

Définir le comportement de restauration

Vous pouvez définir le comportement de restauration automatique sur disabled ou default après le lancement de l'instance. La configuration par défaut n'autorise pas la restauration automatique simplifiée pour un type d'instance non pris en charge.

Console
Pour désactiver la récupération automatique simplifiée lors du lancement de l'instance
  1. Ouvrez la console Amazon EC2 à l'adresse https://console.aws.amazon.com/ec2/.

  2. Dans le panneau de navigation, choisissez Instances, puis Launch instance (Lancer une instance).

  3. Dans la section Advanced details (Détails avancés), pour nstance auto-recovery (Récupération automatique de l'instance), sélectionnez Disabled (Désactivé).

  4. Configurez les paramètres de lancement de l'instance restants selon les besoins, puis lancez l'instance.

Désactivation de la récupération automatique simplifiée d'une instance en cours d'exécution ou arrêtée
  1. Ouvrez la console Amazon EC2 sur https://console.aws.amazon.com/ec2/.

  2. Dans le panneau de navigation, choisissez instances.

  3. Sélectionnez l'instance, puis choisissez Actions, Instance Settings (Paramètres de l'instance), Change auto-recovery Behavior (Changer le comportement de restauration automatique).

  4. Choisissez Off (Désactiver), puis Save (Enregistrer).

Pour définir le comportement de récupération automatique sur default pour une instance en cours d'exécution ou arrêtée
  1. Ouvrez la console Amazon EC2 sur https://console.aws.amazon.com/ec2/.

  2. Dans le panneau de navigation, choisissez instances.

  3. Sélectionnez l'instance, puis choisissez Actions, Instance Settings (Paramètres de l'instance), Change auto-recovery Behavior (Changer le comportement de restauration automatique).

  4. Choisissez Par défaut (Activé), puis Enregistrer.

AWS CLI
Désactivation de la récupération automatique simplifiée au lancement

Utilisez la commande run-instances.

aws ec2 run-instances \ --image-id ami-1a2b3c4d \ --instance-type t2.micro \ --key-name MyKeyPair \ --maintenance-options AutoRecovery=Disabled \ [...]
Désactivation de la récupération automatique simplifiée d'une instance en cours d'exécution ou arrêtée

Utilisez la commande modify-instance-maintenance-options.

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery disabled
Pour définir le comportement de récupération automatique sur default pour une instance en cours d'exécution ou arrêtée

Utilisez la commande modify-instance-maintenance-options.

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery default

Récupération basée sur l'action Amazon CloudWatch

Utilisez la récupération basée sur les actions Amazon CloudWatch si vous souhaitez personnaliser le moment de la récupération de votre instance.

Lorsque l'alarme StatusCheckFailed_System est déclenchée et que l'action de récupération est initiée, vous serez averti par la rubrique Amazon SNS que vous avez sélectionnée quand vous avez créé l'alarme et associé l'action de récupération. Lorsque l'action de récupération est terminée, les informations sont publiées dans la rubrique Amazon SNS que vous avez configurée pour l'alarme. Toutes les personnes abonnées à cette rubrique Amazon SNS reçoivent une notification par e-mail qui inclut le statut de la tentative de récupération et les éventuelles instructions supplémentaires. Lors de la dernière étape de l'action de récupération, l'instance récupérée redémarre.

Vous pouvez utiliser des alarmes Amazon CloudWatch pour récupérer une instance même si la récupération automatique simplifiée n'est pas désactivée. Pour plus d'informations sur la création d'une alarme Amazon CloudWatch pour récupérer une instance, consultez Ajouter des actions de récupération aux alarmes Amazon CloudWatch.

Types d'instance pris en charge

Tous les types d'instances pris en charge par la restauration automatique simplifiée sont également pris en charge par la restauration basée sur des actions CloudWatch. De plus, la restauration basée sur des actions Amazon CloudWatch prend en charge les types d'instances suivants avec des volumes de stockage d'instances.

  • Usage général : M3

  • Optimisés pour le calcul : C3

  • À mémoire optimisée : R3 | X1 | X1e | X2idn | X2iedn

Important

Si des volumes de stockage d'instances sont attachés à l'instance, les données sont perdues pendant la récupération.

La restauration basée sur des actions Amazon CloudWatch ne prend pas en charge la restauration pour les instances disposant d'hôtes dédiés Amazon EC2 et les instances métalliques.

Vous pouvez utiliser la AWS Management Console ou l'AWS CLI pour afficher les types d'instance qui prennent en charge la récupération basée sur les actions Amazon CloudWatch.

Console
Pour afficher les types d'instance qui prennent en charge la récupération basée sur les actions Amazon CloudWatch
  1. Ouvrez la console Amazon EC2 sur https://console.aws.amazon.com/ec2/.

  2. Dans le panneau de navigation de gauche, choisissez Instance Types (Types d'instance).

  3. Dans la barre de filtre, saisissez Auto Recovery support: true (Prise en charge de la restauration automatique : vrai). Sinon, lorsque vous saisissez les caractères et que le nom du filtre apparaît, vous pouvez le sélectionner.

    Le tableau des Types d'instance affiche tous les types d'instance qui prennent en charge la récupération basée sur les actions Amazon CloudWatch.

AWS CLI
Pour afficher les types d'instance qui prennent en charge la récupération basée sur les actions Amazon CloudWatch

Utilisez la commande describe-instance-types.

aws ec2 describe-instance-types --filters Name=auto-recovery-supported,Values=true --query "InstanceTypes[*].[InstanceType]" --output text | sort

Résoudre les défaillances de récupération d'instance

Les problèmes suivants peuvent causer l'échec de la récupération de votre instance :

  • Lors d'événements du Service Health Dashboard, la récupération automatique simplifiée peut ne pas récupérer votre instance. Il se peut que vous ne receviez pas de notifications d'échec de récupération pour de tels événements. Tous les événements du Service Health Dashboard (tableau de bord de service d'état) en cours peuvent empêcher la restauration basée sur des actions CloudWatch de récupérer une instance. Pour obtenir les dernières informations sur la disponibilité des services, consultez http://status.aws.amazon.com/.

  • Capacité temporaire, insuffisante du matériel de remplacement.

  • L'instance a atteint l'autorisation quotidienne maximale de trois tentatives de récupération.

Le processus de récupération automatique tente de récupérer votre instance pour trois défaillances distinctes par jour au maximum. Si l'échec du contrôle de statut du système d'instance persiste, nous vous recommandons d'arrêter et de démarrer manuellement l'instance. Les données sur les volumes de stockage d'instances sont perdues lorsque l'instance est arrêtée. Pour de plus amples informations, veuillez consulter Arrêt et démarrage de votre instance.

Votre instance pourrait ensuite être retirée si la récupération automatique échoue et si une dégradation matérielle est la cause première de l'échec du contrôle de statut du système d'origine.