Résoudre les problèmes liés à Amazon ECS Anywhere - Amazon Elastic Container Service

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Résoudre les problèmes liés à Amazon ECS Anywhere

Amazon ECS Anywhere fournit une assistance pour l'enregistrement d'une instance externe telle qu'un serveur sur site ou une machine virtuelle (VM) sur votre ECS cluster Amazon. Voici les problèmes courants que vous pouvez rencontrer et les recommandations générales pour leur résolution.

Problèmes d'enregistrement d'instance externe

Lors de l'enregistrement d'une instance externe auprès de votre ECS cluster Amazon, les conditions suivantes doivent être remplies :

  • Une AWS Systems Manager activation, qui consiste en un ID d'activation et un code d'activation, doit être récupérée. Vous l'utilisez pour enregistrer l'instance externe en tant qu'instance gérée par Systems Manager. Lorsqu'une activation de Systems Manager est demandée, spécifiez une limite d'enregistrement et une date d'expiration. La limite d'enregistrement spécifie le nombre maximal d'instances qui peuvent être enregistrées à l'aide de l'activation. La valeur par défaut pour la limite d'enregistrement est 1 instance. La date d'expiration spécifie la date à laquelle l'activation expire. La valeur par défaut est 24 heures. Si l'activation de Systems Manager que vous utilisez pour enregistrer votre instance externe n'est pas valide, demandez-en une nouvelle. Pour de plus amples informations, veuillez consulter Enregistrement d'une instance externe dans un ECS cluster Amazon.

  • Une IAM politique est utilisée pour fournir à votre instance externe les autorisations dont elle a besoin pour communiquer avec AWS API les opérations. Si cette stratégie gérée n'est pas créée correctement et ne contient pas les autorisations requises, l'enregistrement d'instance externe échoue. Pour de plus amples informations, veuillez consulter IAMRôle Amazon ECS Anywhere.

  • Amazon ECS fournit un script d'installation qui installe Docker, l'agent de ECS conteneur Amazon et l'agent Systems Manager sur votre instance externe. Si le script d'installation échoue, il est probable qu'il ne puisse plus être exécuté sur la même instance sans qu'une erreur ne se produise. Dans ce cas, suivez le processus de nettoyage pour effacer les AWS ressources de l'instance afin de pouvoir réexécuter le script d'installation. Pour de plus amples informations, veuillez consulter Annulation de l'enregistrement d'une instance externe Amazon ECS.

    Note

    Sachez que si le script d'installation a demandé et utilisé avec succès l'activation de Systems Manager, toute autre exécution du script d'installation utilise à nouveau l'activation de Systems Manager. Cela peut à son tour vous amener à atteindre la limite d'enregistrement pour cette activation. Si cette limite est atteinte, vous devez recréer une activation.

  • Lors de l'exécution du script d'installation sur une instance externe pour les GPU charges de travail, si le NVIDIA pilote n'est pas détecté ou configuré correctement, une erreur se produit. Le script d'installation utilise la nvidia-smi commande pour confirmer l'existence du NVIDIA pilote.

Problèmes de réseau d'instance externe

Pour communiquer toute modification, votre instance externe nécessite une connexion réseau à AWS. Si votre instance externe perd sa connexion réseau AWS, les tâches exécutées sur vos instances continuent de s'exécuter de toute façon, sauf si elles sont arrêtées manuellement. Une fois la connexion rétablie, les AWS informations d'identification utilisées par l'agent de ECS conteneur Amazon et l'agent Systems Manager sur l'instance externe sont renouvelées automatiquement. AWS Pour plus d'informations sur les AWS domaines utilisés pour la communication entre votre instance externe et AWS, consultezRéseaux .

Problèmes d'exécution de tâches sur votre instance externe

Si vos tâches ou conteneurs ne parviennent pas à s'exécuter sur votre instance externe, cela est généralement dû au réseau ou aux autorisations. Si vos conteneurs extraient leurs images d'Amazon ECR ou sont configurés pour envoyer les journaux des conteneurs à CloudWatch Logs, votre définition de tâche doit spécifier un IAM rôle d'exécution de tâche valide. Sans IAM rôle d'exécution de tâche valide, vos conteneurs ne démarreront pas. Pour en savoir plus sur les problèmes liés au réseau, consultez Problèmes de réseau d'instance externe.

Important

Amazon ECS fournit l'outil de collecte ECS des journaux Amazon. Vous pouvez l'utiliser pour collecter des journaux de vos instances externes à des fins de dépannage. Pour de plus amples informations, veuillez consulter Collecte des journaux de conteneurs avec Amazon ECS Logs Collector .