Résolution d’un problème d’instance inaccessible - Amazon Elastic Compute Cloud

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Résolution d’un problème d’instance inaccessible

Vous pouvez utiliser les méthodes suivantes pour dépanner une instance Amazon EC2 inaccessible.

Redémarrage d’instance

La capacité de redémarrer des instances qui sont généralement inaccessibles est précieuse pour le dépannage et la gestion générale des instances.

Tout comme vous pouvez réinitialiser un ordinateur en appuyant sur le bouton approprié, vous pouvez réinitialiser les instances EC2 en utilisant la console, l'interface ligne de commande ou l'API d'Amazon EC2. Pour plus d’informations, consultez Redémarrer votre instance.

Sortie de la console de l’instance

La sortie de la console est un outil de valeur pour le diagnostic des problèmes. Elle est particulièrement utile pour la résolution des problèmes liés au noyau et à la configuration des services qui pourraient mettre fin à une instance ou la rendre inaccessible avant que son programme fantôme SSH ne puisse être démarré.

  • Instances Linux : la sortie de la console d'instance affiche exactement la sortie de console qui serait normalement affichée sur un moniteur physique connecté à un ordinateur. La sortie de la console renvoie des informations mises en mémoire tampon qui ont été publiées après un état de transition d’instance (démarrage, arrêt, redémarrage et résiliation). La sortie publiée n’est pas continuellement mise à jour, uniquement lorsqu’elle est probablement très bénéfique.

  • Instances Windows : le résultat de la console d'instance inclut les trois dernières erreurs du journal des événements du système.

Vous pouvez éventuellement extraire la dernière sortie de console série à tout moment au cours du cycle de vie de l’instance. Cette option n'est prise en charge que sur les instances créées sur le système AWS Nitro. Elle n’est pas prise en charge via la console Amazon EC2.

Note

Seuls les 64 Ko les plus récents de la sortie publiée sont stockés et disponibles pendant au moins 1 heure après la dernière publication.

Seul le propriétaire de l’instance peut accéder à la sortie de la console.

Utilisez l’une des méthodes suivantes pour obtenir la sortie de la console.

Console
Pour obtenir la sortie de la console
  1. Ouvrez la console Amazon EC2 à l’adresse https://console.aws.amazon.com/ec2/.

  2. Dans le panneau de navigation de gauche, sélectionnez instances.

  3. Sur la page Instances, sélectionnez Actions, Surveiller et dépanner, puis Obtenir le journal système.

Command line
Pour obtenir la sortie de la console

Vous pouvez utiliser l’une des commandes suivantes. Pour plus d’informations sur les CLI (interface ligne de commande), consultez Accès à Amazon EC2.

Création d’une capture d’écran d’une instance inaccessible

Si vous ne parvenez pas à vous connecter à votre instance, vous pouvez en faire une capture d'écran et l'afficher sous forme d'image. Cette image permet de voir le statut de l’instance et de résoudre le problème plus rapidement.

Vous pouvez générer des captures d’écran pendant que l’instance s’exécute ou après son blocage. L’image est générée au format JPG et ne dépasse pas 100 Ko. Aucun coût de transfert de données n’est facturé pour la capture d’écran.

Limites

Cette fonctionnalité n’est pas prise en charge dans les cas suivants :

Régions prises en charge

Cette fonction est disponible dans les régions suivantes :

  • US East (N. Virginia) Region

  • Région US East (Ohio)

  • Région US West (N. California)

  • Région US West (Oregon)

  • Région Afrique (Le Cap)

  • Région Asie-Pacifique (Hong Kong)

  • Région Asie-Pacifique (Hyderabad)

  • Région Asie-Pacifique (Jakarta)

  • Région Asie-Pacifique (Melbourne)

  • Région Asie-Pacifique (Mumbai)

  • Région Asie-Pacifique (Osaka)

  • Région Asie-Pacifique (Séoul)

  • Région Asie-Pacifique (Singapour)

  • Région Asie-Pacifique (Sydney)

  • Région Asie-Pacifique (Tokyo)

  • Région Canada (Centre)

  • Région Canada Ouest (Calgary)

  • Région Chine (Beijing)

  • Région Chine (Ningxia)

  • Région Europe (Frankfurt)

  • Région Europe (Irlande)

  • Région Europe (London)

  • Europe (Milan) Region

  • Région Europe (Paris)

  • Région Europe (Espagne)

  • Région Europe (Stockholm)

  • Région Europe (Zurich)

  • Région Israël (Tel Aviv)

  • Région Amérique du Sud (São Paulo)

  • Middle East (Bahrain) Region

  • Région du Moyen-Orient (EAU)

Console
Obtention d’une capture d’écran d’une instance
  1. Ouvrez la console Amazon EC2 à l’adresse https://console.aws.amazon.com/ec2/.

  2. Dans le panneau de navigation de gauche, choisissez Instances.

  3. Sélectionnez l’instance à capturer.

  4. Sélectionnez Actions, Surveiller et dépanner puis Obtenir la capture d’écran d’instance.

  5. Sélectionnez Téléchargerou cliquez avec le bouton droit sur l’image pour la télécharger et l’enregistrer.

Command line
Création d’une capture d’écran d’instance

Vous pouvez utiliser l’une des commandes suivantes. Le contenu renvoyé est codé en base64. Pour plus d’informations sur les CLI (interface ligne de commande), consultez Accès à Amazon EC2.

Captures d'écran courantes pour les instances Windows

Aidez-vous des informations suivantes pour faciliter le dépannage d’une instance Windows inaccessible grâce aux captures d’écran renvoyées par le service.

Écran de connexion (Ctrl+Alt+Suppr)

Le service de capture d’écran de la console a renvoyé ce qui suit.

Écran de connexion.

Si une instance devient inaccessible au cours de la connexion, le problème peut venir de votre configuration réseau ou des services Bureau à distance de Windows. Une instance peut également ne pas réagir si un processus utilise une quantité de mémoire important.

Configuration réseau

Utilisez les informations suivantes pour vérifier que votre configuration réseau AWS, celle de Microsoft Windows et celle de votre réseau local (ou local) ne bloquent pas l'accès à l'instance.

AWS configuration réseau
Configuration Vérifier
Configuration du groupe de sécurité Vérifiez que le port 3389 est ouvert pour votre groupe de sécurité. Vérifiez que vous vous connectez à l’adresse IP publique appropriée. Si l’instance n’a pas été associée à une EIP, l’adresse IP publique change après l’arrêt ou le démarrage de l’instance. Pour plus d’informations, consultez Le service Bureau à distance ne peut pas se connecter à l’ordinateur distant.
Configuration de VPC (ACL réseau) Vérifiez que la liste de contrôle d’accès (ACL) de votre Amazon VPC ne bloque pas l’accès. Pour plus d’informations, consultez ACL réseau dans le Amazon VPC Guide de l’utilisateur.
Configuration VPN Si vous vous connectez au VPC à l’aide d’un réseau privé virtuel (VPN), vérifiez la connectivité du tunnel VPN. Pour plus d’informations, consultez la page Comment résoudre les problèmes de connectivité des tunnels VPN au VPC Amazon ?
Configuration du réseau Windows
Configuration Vérifier
Pare-feu Windows Vérifiez que le pare-feu Windows ne bloque pas les connexions à votre instance. Désactivez le pare-feu Windows, comme décrit à l’étape 7 de la section de résolution des problèmes liés au service Bureau à distance, Le service Bureau à distance ne peut pas se connecter à l’ordinateur distant.
Configuration TCP/IP avancée (utilisation d’une adresse IP statique) L’instance peut ne pas réagir flottee que vous avez configuré une adresse IP statique. Pour un VPC, créez une interface réseau et attachez-la à l’instance.

Configuration réseau locale ou sur site

Vérifiez qu’une configuration réseau locale ne bloque pas l’accès. Essayez de vous connecter à une autre instance du même VPC comme l’instance inaccessible. Si vous ne parvenez pas à accéder à une autre instance, contactez votre administrateur de réseau local pour déterminer si une politique locale restreint l’accès.

Problème lié aux services Bureau à distance

Si l’instance n’est pas accessible lors de la connexion, le problème peut venir des services RDS sur l’instance.

Astuce

Vous pouvez utiliser le runbook AWSSupport-TroubleshootRDP pour vérifier et modifier divers paramètres susceptibles d’affecter les connexions RDP (Remote Desktop Protocol). Pour plus d’informations, consultez AWSSupport-TroubleshootRDP dans la référence AWS Systems Manager Automation runbook.

Configuration des services Bureau à distance (RDS)
Configuration Vérifier
Le service RDS est en cours d’exécution Vérifiez que le service RDS est exécuté sur l’instance. Connectez-vous à l’instance via le composant logiciel enfichable Services (services.msc) de Microsoft Management Console (MMC). Dans la liste des services, vérifiez que Services Bureau à distance est défini sur En cours d’exécution. Si ce n’est pas le cas, démarrez-le, puis définissez le type de démarrage sur Automatique. Si vous ne parvenez pas à vous connecter à l’instance en utilisant le composant logiciel enfichable Services, détachez le volume racine de l’instance, créez un instantané ou une AMI du volume, attachez le volume d’origine à une autre instance dans la même zone de disponibilité en tant que volume secondaire et modifiez la clé de registre Start. Lorsque vous avez terminé, rattachez le volume racine à l’instance d’origine.
Le service RDS est activé

Même si le service a été lancé, il peut être désactivé. Détachez le volume racine de l’instance, prenez un instantané du volume ou créez une AMI, attachez le volume d’origine à une autre instance dans la même zone de disponibilité en tant que volume secondaire, puis activez le service en modifiant la clé de registre Terminal Server comme décrit dans Activation du Bureau à distance sur une instance EC2 avec le Registre à distance.

Lorsque vous avez terminé, rattachez le volume racine à l’instance d’origine.

Utilisation élevée du processeur

Vérifiez la métrique CPUUtilization (Maximum) sur votre instance à l'aide d'Amazon. CloudWatch Si la valeur CPUUtilization (Maximum) est élevée, attendez qu’elle baisse, puis essayez de vous reconnecter. Une utilisation élevée de l’UC a plusieurs origines possibles :

  • Windows Update

  • Analyse des logiciels de sécurité

  • Script de démarrage personnalisé

  • Planificateur de tâches

Pour plus d'informations, consultez Obtenir des statistiques pour une ressource spécifique dans le guide de CloudWatch l'utilisateur Amazon. Pour des conseils de dépannage supplémentaires, consultez la page Utilisation élevée du processeur peu après le démarrage de Windows (instances Windows uniquement).

Écran de la console de récupération

Le service de capture d’écran de la console a renvoyé ce qui suit.

Capture d’écran de la console de récupération.

Le système d’exploitation peut démarrer dans la console de récupération et rester bloqué dans cet état si la stratégie bootstatuspolicy n’est pas définie sur ignoreallfailures. Utilisez la procédure suivante pour remplacer la configuration bootstatuspolicy par ignoreallfailures.

Par défaut, la configuration des politiques pour les AMI Windows publiques fournies par AWS est définie surignoreallfailures.

  1. Arrêtez l’instance inaccessible.

  2. Créez un instantané du volume racine. Le volume racine est attaché à l’instance en tant que /dev/sda1.

    Détachez le volume racine de l’instance inaccessible, créez un instantané ou une AMI du volume et attachez-le à une autre instance dans la même zone de disponibilité en tant que volume secondaire.

    Avertissement

    Si votre instance temporaire et l’instance d’origine sont lancées grâce à la même AMI, vous devez effectuer des étapes supplémentaires ou vous ne pourrez pas démarrer l’instance d’origine après la restauration de son volume racine en raison d’une collision de signature de disque. Si vous devez créer une instance temporaire à l’aide de la même AMI pour éviter une collision de signature de disque, complétez les étape en Collision de signature de disque.

    Sinon, sélectionnez une autre AMI pour l’instance temporaire. Par exemple, si l'instance d'origine utilise une AMI pour Windows Server 2016, lancez l'instance temporaire à l'aide d'une AMI pour Windows Server 2019.

  3. Connectez-vous à l’instance et exécutez la commande suivante à partir d’une invite de commande pour remplacer la configuration bootstatuspolicy par ignoreallfailures.

    bcdedit /store Drive Letter:\boot\bcd /set {default} bootstatuspolicy ignoreallfailures
  4. Rattachez le volume à l’instance inaccessible et redémarrez cette dernière.

Écran du gestionnaire de démarrage Windows

Le service de capture d’écran de la console a renvoyé ce qui suit.

Écran du gestionnaire de démarrage Windows.

Le système d’exploitation a subi une corruption irrécupérable dans le système de fichier et/ou le registre. Lorsque l’instance est bloquée dans cet état, vous devez récupérer l’instance à partir d’une AMI de sauvegarde récente ou lancer une instance de remplacement. Si vous devez accéder aux données de l’instance, détachez les volumes racines de l’instance inaccessible, créez un instantané ou une AMI de ces volumes et attachez-les à une autre instance dans la même zone de disponibilité en tant que volume secondaire.

Écran Sysprep

Le service de capture d’écran de la console a renvoyé ce qui suit.

Écran Sysprep.

Vous voyez cet écran si vous n’avez pas utilisé le service EC2Config pour appeler Sysprep ou si le système d’exploitation a échoué lors de l’exécution de Sysprep. Vous pouvez réinitialiser le mot de passe à l’aide EC2Rescue. Sinon, consultez Création d'une AMI avec Windows Sysprep.

Écran de préparation

Le service de capture d’écran de la console a renvoyé ce qui suit.

Écran de préparation.

Actualisez le service de capture d’écran de la console d’instance plusieurs fois pour vérifier que l’anneau de progression tourne. Si l’anneau tourne, attendez que le système d’exploitation démarre. Vous pouvez également vérifier la métrique CPUUtilization (Maximum) sur votre instance en utilisant Amazon CloudWatch pour vérifier si le système d'exploitation est actif. Si l’anneau de progression ne tourne pas, l’instance est peut-être bloquée au niveau du processus de démarrage. Redémarrez l’instance. Si le redémarrage ne résout pas le problème, récupérez l’instance à partir d’une AMI de sauvegarde récente ou lancez une instance de remplacement. Si vous avez besoin d’accéder aux données de l’instance, détachez le volume racine de l’instance inaccessible et créez un instantané ou une AMI du volume. Attachez-le ensuite à une autre instance de la même zone de disponibilité en tant que volume secondaire.

Écran Windows Update

Le service de capture d’écran de la console a renvoyé ce qui suit.

Écran Windows Update.

Le processus Windows Update met à jour le registre. Attendez que la mise à jour soit terminée. Ne redémarrez ou n’arrêtez pas l’instance, car cela peut entraîner une corruption des données au cours de la mise à jour.

Note

Le processus Windows Update peut utiliser des ressources sur le serveur au cours de la mise à jour. Si vous rencontrez souvent ce problème, pensez à utiliser des types d’instance et des volumes EBS plus rapides.

Chkdsk

Le service de capture d’écran de la console a renvoyé ce qui suit.

Écran Chkdsk.

Windows exécute l’outil système chkdsk sur le disque pour vérifier l’intégrité du système de fichiers et pour corriger les erreurs système des fichiers logiques. Attendez que le processus se termine.

Récupération d’instance en cas de plantage de l’ordinateur hôte

S’il existe un problème irrécupérable lié au matériel d’un ordinateur hôte sous-jacent, AWS peut planifier un évènement d’arrêt d’instance. Vous êtes averti d’un tel événement en avance par e-mail.

Pour récupérer une instance basée sur Amazon EBS en cours d’exécution sur un ordinateur hôte qui a planté
  1. Sauvegardez les données importantes qui se trouvent sur les volumes de stockage d’instance sur Amazon EBS ou Amazon S3.

  2. Arrêtez l’instance.

  3. Démarrez l’instance.

  4. Restaurez toutes les données importantes.

Pour plus d’informations, consultez Arrêtez et démarrez les instances Amazon EC2.

Pour récupérer une instance basée sur le stockage d’instance et exécutée sur un ordinateur hôte qui a planté
  1. Créez une AMI à partir de l’instance.

  2. Chargez l’image vers Amazon S3.

  3. Sauvegardez les données importantes sur Amazon EBS ou Amazon S3.

  4. Mettez fin à l’instance.

  5. Lancez une nouvelle instance depuis l’AMI.

  6. Restaurez toutes les données importantes sur la nouvelle instance.