Observation des erreurs lors de l'initialisation des nœuds de calcul

Les sections suivantes fournissent des conseils de résolution des problèmes lorsque vous constatez des erreurs lors de l'initialisation des nœuds de calcul. Cela inclut les erreurs d'amorçage, l'affichage des erreurs dans les journaux et la marche à suivre si aucun des scénarios ne s'applique à votre situation spécifique.

Rubriques

Voir Node bootstrap error dans clustermgtd.log
J'ai configuré des réservations de capacité à la demande (ODCRs) ou des instances réservées zonales
Voir An error occurred (VcpuLimitExceeded)slurm_resume.log quand je ne parviens pas à exécuter une tâche, ou quand je ne parviens pas à créer un cluster clustermgtd.log
Voir An error occurred (InsufficientInstanceCapacity)slurm_resume.log quand je ne parviens pas à exécuter une tâche, ou quand je ne parviens pas à créer un cluster clustermgtd.log
Voir que les nœuds sont en DOWN état avec Reason (Code:InsufficientInstanceCapacity)...
Voir cannot change locale (en_US.utf-8) because it has an invalid name dans slurm_resume.log
Aucun des scénarios précédents ne s'applique à ma situation

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Essayer de mettre à niveau la pile AWS ParallelCluster d'API

Voir Node bootstrap error dans clustermgtd.log