Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Configuration des plugins de filtre CLI Slurm sur un cluster PCS AWS
Configurez les plug-ins de filtre CLI lorsque vous créez un nouveau cluster AWS PCS. Vous pouvez activer ou désactiver les plug-ins de filtrage CLI sur les clusters existants à l'aide de l'API de mise à jour ou de la console sans recréer le cluster.
Conditions préalables
Avant de configurer les plug-ins de filtre CLI, effectuez les tâches suivantes :
-
Écrire et tester un script Lua qui implémente l'API du plugin CLI Filter
-
Nommez exactement votre script Lua
cli_filter.lua -
Choisissez une méthode pour déployer votre script sur toutes les instances de cluster (AMI, S3 ou système de fichiers)
-
Vérifiez que vous utilisez la version 24.11 ou ultérieure de Slurm
Activer les plug-ins de filtrage CLI sur un nouveau cluster
Déployer des scripts du plugin CLI Filter
Pour déployer des scripts du plug-in CLI Filter sur votre cluster
-
Assurez-vous que Slurm AMIs est installé sur tous les groupes de nœuds de calcul via le programme d'installation de AWS PCS Slurm.
Note
Si vous utilisez l'AMI AWS PCS Sample pour tous les groupes de nœuds de calcul, ignorez cette étape. Slurm est déjà installé.
-
Déployez votre
cli_filter.luascript/etc/aws/pcs/scheduler/slurm-<version>/cli_filter.luasur toutes les instances du cluster.Par exemple, pour la version 24.11 de Slurm :
/etc/aws/pcs/scheduler/slurm-24.11/cli_filter.lua -
Lancez tous les nœuds de connexion et de calcul à l'aide de votre système préparé AMIs.
-
Testez la soumission des tâches pour vérifier que le plug-in CLI Filter s'exécute correctement.
Activer ou désactiver les plug-ins de filtrage CLI sur les clusters existants
Vous pouvez activer ou désactiver les plug-ins de filtrage CLI sur les clusters existants sans avoir à reconstruire votre infrastructure. Pour de plus amples informations, veuillez consulter Mettre à jour un cluster dans AWS PCS.
Résultats attendus
Après avoir terminé la configuration :
-
Votre cluster est créé avec le plug-in CLI Filter activé
-
Les offres d'emploi déclenchent votre logique de validation personnalisée avant d'atteindre le contrôleur Slurm
-
Les tâches non conformes sont rejetées avec vos messages d'erreur personnalisés
-
Les tâches conformes se déroulent normalement via le planificateur Slurm
Résolution des problèmes
- Script du plugin CLI Filter manquant sur n'importe quel nœud
-
Symptômes : la soumission du Job échoue immédiatement avec une erreur de chargement du plugin.
Cause probable : le script n'a pas été déployé sur toutes les instances ou le chemin ou le nom du fichier est incorrect.
Solution : Vérifiez que le script existe au bon chemin sur tous les nœuds de connexion et de calcul avec le nom de fichier exact
cli_filter.lua. - Configuration du plugin de filtre CLI non valide
-
Symptômes : la création du cluster échoue en raison d'une erreur de validation.
Cause probable :
CliFilterPluginsle paramètre n'est pas défini sur lecli_filter/luaformat.Résolution : utilisez la valeur exacte du paramètre
cli_filter/luadansslurmCustomSettings.