Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Quando crei un cluster Slurm su HyperPod, l' HyperPod agente configura gres.conf
slurm.conf
/opt/slurm/etc/
per gestire il cluster Slurm in base alla richiesta di creazione del cluster e agli script HyperPod del ciclo di vita. L'elenco seguente mostra quali parametri specifici l'agente gestisce e sovrascrive. HyperPod
Importante
Si consiglia vivamente di non modificare questi parametri gestiti da HyperPod.
-
In
slurm.conf
, HyperPod imposta i seguenti parametri di base: ClusterName
SlurmctldHost
,PartitionName
, eNodeName
.Inoltre, per abilitare la Ripresa automatica funzionalità, HyperPod richiede i
SchedulerParameters
parametriTaskPlugin
e impostati come segue. Per impostazione predefinita, l' HyperPod agente imposta questi due parametri con i valori richiesti.TaskPlugin=task/none SchedulerParameters=permit_job_expansion
-
In
gres.conf
, HyperPod gestisce NodeName
i nodi GPU.