Personalización de la configuración de Slurm - AWS ParallelCluster

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Personalización de la configuración de Slurm

A partir de AWS ParallelCluster versión 3.6.0, puede personalizar la slurm.conf configuración de Slurm en una configuración de clúster AWS ParallelCluster.

En la configuración del clúster, puede personalizar los parámetros Slurm de configuración mediante los siguientes ajustes de configuración del clúster:

Límites de personalización de la configuración de Slurm y consideraciones a tener en cuenta al usar AWS ParallelCluster

  • En cuanto a la configuración CustomSlurmSettings y CustomSlurmSettingsIncludeFile, solo puede especificar y actualizar los parámetros de slurm.conf que estén incluidos en la Slurmversión compatible con la versión AWS ParallelCluster que esté utilizando para configurar un clúster.

  • Si especifica configuraciones de Slurm personalizadas en alguno de los parámetros de CustomSlurmSettings, AWS ParallelCluster realiza comprobaciones de validación e impide establecer o actualizar los parámetros de configuración de Slurm que entren en conflicto con la lógica AWS ParallelCluster. Los parámetros de configuración de Slurm con los que se sabe que entran en conflicto con AWS ParallelCluster se identifican en las listas de denegación. Las listas de denegación pueden cambiar en futuras versiones de AWS ParallelCluster si se añaden otras funciones de Slurm. Para obtener más información, consulte Parámetros de configuración de Slurm enumerados en denegación para CustomSlurmSettings.

  • AWS ParallelCluster solo comprueba si un parámetro está en una lista de denegaciones. AWS ParallelCluster no valida la sintaxis ni la semántica de los parámetros de configuración personalizados de Slurm. Usted es responsable de validar los parámetros de configuración de Slurm personalizados. Los parámetros de configuración personalizados de Slurm no válidos pueden provocar errores en los daemons de Slurm y provocar errores en la creación y actualización del clúster.

  • Si especifica configuraciones personalizadas de Slurm en CustomSlurmSettingsIncludeFile, AWS ParallelCluster no realiza ninguna validación.

  • Puede actualizar CustomSlurmSettings y CustomSlurmSettingsIncludeFile sin detener ni iniciar la flota de cómputo. En este caso, AWS ParallelCluster reinicia el daemon de slurmctld y ejecuta el comando scontrol reconfigure.

    Es posible que algunos parámetros de configuración de Slurm requieran operaciones diferentes antes de que se registre un cambio en todo el clúster. Por ejemplo, es posible que requieran el reinicio de todos los daemons del clúster. Usted es responsable de comprobar si las operaciones del AWS ParallelCluster son suficientes para propagar los parámetros de configuración personalizados de Slurm durante las actualizaciones. Si considera que las operaciones de AWS ParallelCluster no son suficientes, es su responsabilidad realizar las acciones adicionales necesarias para propagar la configuración actualizada, tal como se recomienda en la Slurmdocumentación.

Parámetros de configuración de Slurm enumerados en denegación para CustomSlurmSettings

En las tablas siguientes se enumeran los parámetros con las versiones de AWS ParallelCluster que deniegan su uso, empezando por la versión 3.6.0. CustomSlurmSettings no es compatible con versiones de AWS ParallelCluster anteriores a la 3.6.0.

Parámetros de la lista de denegación a nivel de clúster:
Parámetro Slurm Listado de denegación en las versiones de AWS ParallelCluster

CommunicationParameters

3.6.0

Epilog

3.6.0

GresTypes

3.6.0

LaunchParameters

3.6.0

Prolog

3.6.0

ReconfigFlags

3.6.0

ResumeFailProgram

3.6.0

ResumeProgram

3.6.0

ResumeTimeout

3.6.0

SlurmctldHost

3.6.0

SlurmctldLogFile

3.6.0

SlurmctldParameters

3.6.0

SlurmdLogfile

3.6.0

SlurmUser

3.6.0

SuspendExcNodes

3.6.0

SuspendProgram

3.6.0

SuspendTime

3.6.0

TaskPlugin

3.6.0

TreeWidth

3.6.0

Parámetros de lista denegados a nivel de clúster cuando la integración de contabilidad nativa de Slurm está configurada en la configuración del clúster:
Parámetro Slurm Listado de denegados en las versiones AWS ParallelCluster

AccountingStorageType

3.6.0

AccountingStorageHost

3.6.0

AccountingStoragePort

3.6.0

AccountingStorageUser

3.6.0

JobAcctGatherType

3.6.0

Parámetros de lista denegados a nivel de cola (partición) para las colas gestionadas por AWS ParallelCluster:
Parámetro Slurm Listado de denegados en las versiones AWS ParallelCluster

Nodos

3.6.0

PartitionName

3.6.0

ResumeTimeout

3.6.0

State

3.6.0

SuspendTime

3.6.0

Parámetros de lista denegados a nivel de recurso de cómputo (nodo) para un recurso de cómputo gestionado por AWS ParallelCluster:
Parámetro Slurm Incluido en la versión denegada de la versión AWS ParallelCluster y en las versiones posteriores

CPUs

3.6.0

Características

3.6.0

Gres

3.6.0

NodeAddr

3.6.0

NodeHostname

3.6.0

NodeName

3.6.0

Weight

3.7.0