Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Configurare i plugin del filtro CLI Slurm su un cluster PCS AWS
Configura i plugin di filtro CLI quando crei un nuovo AWS cluster PCS. Puoi abilitare o disabilitare i plugin di filtro CLI sui cluster esistenti utilizzando l'API o la console di aggiornamento senza ricreare il cluster.
Prerequisiti
Prima di configurare i plugin di filtro CLI, completa queste attività:
-
Scrivi e testa uno script Lua che implementa l'API CLI Filter Plugin
-
Assegna un nome esatto al tuo script Lua
cli_filter.lua -
Scegli un metodo per distribuire lo script su tutte le istanze del cluster (AMI, S3 o file system)
-
Verifica di utilizzare Slurm versione 24.11 o successiva
Abilita i plugin del filtro CLI su un nuovo cluster
Implementa gli script del plugin CLI Filter
Per distribuire gli script del CLI Filter Plugin nel tuo cluster
-
Assicurati che tutti i gruppi di nodi AMIs utilizzati nei gruppi di nodi di calcolo abbiano Slurm installato tramite il programma di installazione PCS Slurm. AWS
Nota
Se utilizzi l'AMI AWS PCS Sample per tutti i gruppi di nodi di calcolo, salta questo passaggio. Slurm è già installato.
-
Implementa
cli_filter.lualo script/etc/aws/pcs/scheduler/slurm-<version>/cli_filter.luasu tutte le istanze del cluster.Ad esempio, per la versione 24.11 di Slurm:
/etc/aws/pcs/scheduler/slurm-24.11/cli_filter.lua -
Avvia tutti i nodi di accesso e calcolo utilizzando i tuoi predisposti. AMIs
-
Verifica l'invio del lavoro per verificare che il plugin CLI Filter venga eseguito correttamente.
Abilita o disabilita i plugin di filtro CLI su cluster esistenti
Puoi abilitare o disabilitare i plugin di filtro CLI sui cluster esistenti senza ricostruire l'infrastruttura. Per ulteriori informazioni, consulta Aggiornamento di un cluster in AWS PCS.
Risultato previsto
Dopo aver completato la configurazione:
-
Il cluster viene creato con il plug-in CLI Filter attivato
-
Gli invii di lavoro attivano la tua logica di convalida personalizzata prima di raggiungere il controller Slurm
-
I lavori non conformi vengono rifiutati con i tuoi messaggi di errore personalizzati
-
I lavori conformi procedono normalmente tramite lo scheduler Slurm
Risoluzione dei problemi
- Script CLI Filter Plugin mancante su qualsiasi nodo
-
Sintomi: l'invio del Job fallisce immediatamente con un errore di caricamento del plugin.
Causa probabile: lo script non è stato distribuito su tutte le istanze o il percorso o il nome del file non sono corretti.
Risoluzione: verifica che lo script esista nel percorso corretto su tutti i nodi di accesso e di calcolo con il nome file esatto.
cli_filter.lua - Configurazione del plugin del filtro CLI non valida
-
Sintomi: la creazione del cluster non riesce e causa un errore di convalida.
Probabile causa:
CliFilterPluginsparametro non impostato sulcli_filter/luaformato.Risoluzione: utilizza il valore esatto del parametro
cli_filter/luainslurmCustomSettings.