Risoluzione dei problemi del plug-in Slurm CLI Filter in PCS AWS - AWS PC

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Risoluzione dei problemi del plug-in Slurm CLI Filter in PCS AWS

Utilizza queste informazioni di risoluzione dei problemi per risolvere i problemi più comuni del CLI Filter Plugin.

L'invio del Job fallisce immediatamente con un errore di caricamento del plugin

Sintomi: gli utenti ricevono messaggi di errore relativi al plug-in di filtro CLI mancante o fallito durante l'invio dei lavori.

Possibili cause:

  • Script CLI Filter Plugin mancante da uno o più nodi

  • Nome del file di script errato (deve essere esattamente) cli_filter.lua

  • Script distribuito in un percorso di directory errato

  • Lo script ha autorizzazioni di file errate

Risoluzione:

  • Verifica che lo script esista /etc/aws/pcs/scheduler/slurm-<version>/cli_filter.lua in tutti i nodi di accesso e di calcolo

  • Controlla che il nome del file dello script sia esattamente cli_filter.lua

  • Assicurati che lo script abbia autorizzazioni leggibili (644 o simili)

  • Verifica la distribuzione degli script su un singolo nodo di accesso prima di distribuirli all'intero cluster

La creazione del cluster non riesce a causa dell'errore di convalida del plugin CLI Filter

Sintomi: la creazione del cluster non riesce e viene generato un errore relativo a un parametro non validoCliFilterPlugins.

Possibili cause:

  • Formato errato del valore del parametro in slurmCustomSettings

  • Digitare il nome o il valore del parametro

Risoluzione:

  • Usa il nome esatto del parametro: CliFilterPlugins

  • Usa il valore esatto del parametro: cli_filter/lua

  • Verifica la sintassi JSON nell'array slurmCustomSettings

Lo script CLI Filter Plugin viene eseguito ma la convalida del lavoro non funziona come previsto

Sintomi: i lavori vengono inviati correttamente, ma la logica di convalida personalizzata non si attiva o produce risultati imprevisti.

Possibili cause:

  • Errori di sintassi dello script Lua

  • Schemi di accesso ai campi errati (utilizzo della sintassi Job Submit Plugin anziché del CLI Filter Plugin)

  • Errori logici nelle condizioni di convalida

Risoluzione:

  • Controlla lo script Lua per eventuali errori di sintassi

  • Verify Field Access utilizza options["field_name"] format anziché job_desc.field_name

  • Aggiungi istruzioni di registrazione al flusso di esecuzione degli script di debug

  • Verifica prima la logica degli script con semplici casi di convalida

La distribuzione degli script S3 non riesce

Sintomi: le istanze vengono avviate ma lo script CLI Filter Plugin non viene scaricato da S3.

Possibili cause:

  • Il profilo dell'istanza IAM non dispone delle autorizzazioni di lettura S3

  • Endpoint VPC S3 non configurato

  • Il bucket S3 o il percorso dell'oggetto nei dati utente non sono corretti

Risoluzione:

  • Verifica che il profilo dell'istanza IAM disponga s3:GetObject dell'autorizzazione per il tuo bucket

  • Configura l'endpoint S3 VPC Gateway per l'accesso diretto

  • Controlla il nome del bucket S3 e il percorso dell'oggetto nello script dei dati utente

  • Esamina i log dei dati utente dell'istanza per verificare eventuali errori di download di S3