Résolution des problèmes dans les clusters avec AWS Batch intégration - AWS ParallelCluster

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Résolution des problèmes dans les clusters avec AWS Batch intégration

Cette section concerne les clusters avec intégration d'un AWS Batch planificateur.

Problèmes liés au nœud principal

Vous pouvez résoudre les problèmes de configuration du nœud principal de la même manière qu'un Slurm cluster (sauf pour les journaux Slurm spécifiques). Pour de plus amples informations sur ces problèmes, veuillez consulter Nœud principal.

Problèmes de calcul

AWS Batch gère les aspects de dimensionnement et de calcul de vos services. Si vous rencontrez des problèmes liés au calcul, consultez la documentation de AWS Batch dépannage pour obtenir de l'aide.

Échecs au travail

Si une tâche échoue, vous pouvez exécuter la awsbout commande pour récupérer le résultat de la tâche. Vous pouvez également exécuter la awsbstat commande pour obtenir un lien vers les journaux des tâches stockés par Amazon CloudWatch.

Erreur d'expiration du délai de connexion en cas d'URL du point de terminaison

Si les tâches parallèles sur plusieurs nœuds échouent avec une erreur : Connect timeout on endpoint URL

  • Dans le journal awsbout de sortie, vérifiez que la tâche est parallèle à plusieurs nœuds par rapport à la sortie : Detected 3/3 compute nodes. Waiting for all compute nodes to start.

  • Vérifiez si le sous-réseau des nœuds de calcul est public.

Les tâches parallèles à nœuds multiples ne prennent pas en charge l'utilisation de sous-réseaux publics lors de leur utilisation AWS Batch dans. AWS ParallelCluster Utilisez un sous-réseau privé pour vos nœuds de calcul et vos tâches. Pour plus d'informations, consultez la section Considérations relatives à l'environnement informatique dans le Guide de AWS Batch l'utilisateur. Pour configurer un sous-réseau privé pour vos nœuds de calcul, consultezAWS ParallelCluster avec AWS Batch planificateur.