Note di rilascio per le versioni Slurm in PCS AWS - AWS PC

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Note di rilascio per le versioni Slurm in PCS AWS

Questo argomento descrive le modifiche importanti per ogni versione di Slurm attualmente supportata in PCS. AWS Ti consigliamo di rivedere le modifiche tra la vecchia e la nuova versione quando aggiorni il tuo cluster.

Modifiche implementate in PCS AWS

Per ulteriori informazioni su Slurm 24.11, consulta le seguenti pubblicazioni:

Modifiche implementate in PCS AWS
  • Il nuovo modulo Slurm Step Manager è ora abilitato di default in AWS PCS. Questo modulo offre vantaggi significativi trasferendo la gestione delle fasi dal controller centrale ai nodi di calcolo, migliorando notevolmente la concorrenza del sistema in ambienti con un utilizzo intensivo delle fasi. Per supportare questa configurazione e isolare Prolog ed Epilog elaborare meglio l'esecuzione, sono abilitati i nuovi flag prolog (,). Contain Alloc

  • La comunicazione gerarchica dal controller ai nodi di calcolo è abilitata per ottimizzare la comunicazione tra nodi Slurm, migliorando la scalabilità e le prestazioni. Inoltre, la configurazione di routing ora utilizza elenchi di nodi di partizione per le comunicazioni dal controller, anziché l'algoritmo di routing predefinito del plug-in, migliorando la resilienza del sistema.

  • Un nuovo plugin hash sostituisce il precedente. HashPlugin=hash/sha3 hash/k12 plugin Questo è ora abilitato di default nei cluster AWS PCS.

  • I log dei controller Slurm ora includono funzionalità di controllo avanzate per tutte le chiamate di procedura remota (RPC) in entrata verso. slurmctld I log includono l'indirizzo di origine, l'utente autenticato e il tipo di RPC prima dell'elaborazione della connessione.

Per ulteriori informazioni su Slurm 24.05, consultate le seguenti pubblicazioni:

Le impostazioni di Slurm possono essere modificate in PCS AWS
  • L'impostazione SuspendTime predefinita è. 60 Utilizzate il parametro di scaleDownIdleTimeInSeconds configurazione AWS PCS per impostarlo. Per ulteriori informazioni, consulta il scaleDownIdleTimeInSecondsparametro del tipo di ClusterSlurmConfiguration dati nel AWS PCS API Reference.

  • La MaxJobCount e MaxArraySize si basa sulla dimensione scelta per il cluster. Per ulteriori informazioni, consulta il sizeparametro dell'azione CreateCluster API nel AWS PCS API Reference.

  • L'impostazione predefinita di SelectTypeParameters Slurm è. CR_CPU Puoi fornirlo come valore per slurmCustomSettings impostarlo quando crei un cluster. Per ulteriori informazioni, consulta il slurmCustomSettingsparametro dell'azione CreateCluster API e il riferimento SlurmCustomSettingall'API AWS PCS.

  • È possibile impostare Prolog e Epilog a livello di cluster. Puoi fornirlo come valore per slurmCustomSettings impostarlo quando crei un cluster. Per ulteriori informazioni, vedere CreateClustere SlurmCustomSettingnel AWS PCS API Reference.

  • È possibile impostare Weight e RealMemory a livello di gruppo di nodi di calcolo. Puoi fornirlo come valore per slurmCustomSettings impostarlo quando crei un gruppo di nodi di calcolo. Per ulteriori informazioni, vedere CreateComputeNodeGroupe SlurmCustomSettingnel AWS PCS API Reference.