Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Résolution des problèmes liés au plugin Slurm CLI Filter sur PCS AWS
Utilisez ces informations de dépannage pour résoudre les problèmes courants du plug-in CLI Filter.
- La soumission du job échoue immédiatement avec une erreur de chargement du plugin
-
Symptômes : les utilisateurs reçoivent des messages d'erreur concernant l'absence ou l'échec du plug-in CLI Filter lorsqu'ils soumettent des tâches.
Causes possibles :
-
Script du plugin CLI Filter absent d'un ou de plusieurs nœuds
-
Nom de fichier de script incorrect (doit être exact
cli_filter.lua) -
Script déployé sur le mauvais chemin de répertoire
-
Le script possède des autorisations de fichier incorrectes
Résolution :
-
Vérifiez que le script existe
/etc/aws/pcs/scheduler/slurm-<version>/cli_filter.luasur tous les nœuds de connexion et de calcul -
Vérifiez que le nom du fichier du script est exact
cli_filter.lua -
Assurez-vous que le script possède des autorisations lisibles (644 ou similaires)
-
Testez le déploiement du script sur un nœud de connexion unique avant de le déployer sur un cluster complet
-
- La création du cluster échoue avec une erreur de validation du plug-in CLI Filter
-
Symptômes : la création du cluster échoue en raison d'une erreur concernant un
CliFilterPluginsparamètre non valide.Causes possibles :
-
Format de valeur de paramètre incorrect dans
slurmCustomSettings -
Faute de frappe dans le nom ou la valeur du paramètre
Résolution :
-
Utilisez le nom exact du paramètre :
CliFilterPlugins -
Utilisez la valeur exacte du paramètre :
cli_filter/lua -
Vérifier la syntaxe JSON dans le
slurmCustomSettingstableau
-
- Le script du plugin CLI Filter s'exécute mais la validation des tâches ne fonctionne pas comme prévu
-
Symptômes : les tâches sont soumises avec succès, mais la logique de validation personnalisée ne se déclenche pas ou ne produit pas de résultats inattendus.
Causes possibles :
-
Erreurs de syntaxe du script Lua
-
Modèles d'accès aux champs incorrects (utilisation de la syntaxe du plugin Job Submit au lieu du plug-in CLI Filter)
-
Erreurs logiques dans les conditions de validation
Résolution :
-
Vérifiez le script Lua pour détecter les erreurs de syntaxe
-
Vérifiez que l'accès aux champs utilise le
options["field_name"]format au lieu dejob_desc.field_name -
Ajouter des instructions de journalisation au flux d'exécution du script de débogage
-
Testez d'abord la logique du script avec des cas de validation simples
-
- Le déploiement du script S3 échoue
-
Symptômes : les instances sont lancées mais le script du plug-in CLI Filter n'est pas téléchargé depuis S3.
Causes possibles :
-
Le profil d'instance IAM ne dispose pas des autorisations de lecture S3
-
Point de terminaison VPC S3 non configuré
-
Chemin d'accès au compartiment ou à l'objet S3 incorrect dans les données utilisateur
Résolution :
-
Vérifiez que le profil d'instance IAM est
s3:GetObjectautorisé à accéder à votre compartiment -
Configurer le point de terminaison S3 VPC Gateway pour un accès direct
-
Vérifiez le nom du compartiment S3 et le chemin de l'objet dans le script de données utilisateur
-
Vérifiez les journaux de données utilisateur de l'instance pour détecter les erreurs de téléchargement de S3
-