Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Notas de publicación de las versiones de Slurm en PCS AWS
En este tema se describen los cambios importantes de cada versión de Slurm actualmente compatible con el PCS. AWS Le recomendamos que revise los cambios entre la versión antigua y la nueva cuando actualice el clúster.
Cambios implementados en el PCS AWS
-
AWS PCS admite la contabilidad de Slurm. Para obtener más información, consulte Contabilidad de barrios bajos en PCS AWS.
Para obtener más información sobre Slurm 24.11, consulte las siguientes publicaciones:
Cambios implementados en el PCS AWS
-
El nuevo módulo Slurm Step Manager ahora está activado por defecto en AWS el PCS. Este módulo ofrece importantes ventajas al transferir la gestión por pasos del controlador central a los nodos de cómputo, lo que mejora sustancialmente la simultaneidad del sistema en entornos con un uso intensivo de pasos. Para admitir esta configuración y aislar
Prolog
yEpilog
procesar mejor los procesos, están habilitados los nuevos indicadores de prólogo (Contain
,Alloc
). -
La comunicación jerárquica entre el controlador y los nodos de cómputo permite optimizar la comunicación entre los nodos de Slurm, lo que mejora la escalabilidad y el rendimiento. Además, la configuración de enrutamiento ahora usa listas de nodos de partición para las comunicaciones desde el controlador, en lugar del algoritmo de enrutamiento predeterminado del complemento, lo que mejora la resiliencia del sistema.
-
Un nuevo complemento de hash
HashPlugin=hash/sha3
reemplaza al anteriorhash/k12 plugin
. Ahora está activado de forma predeterminada en los clústeres de AWS PCS. -
Los registros del controlador Slurm ahora incluyen capacidades de auditoría mejoradas para todas las llamadas entrantes a procedimientos remotos (RPC).
slurmctld
Los registros incluyen la dirección de origen, el usuario autenticado y el tipo de RPC antes del procesamiento de la conexión.
Para obtener más información sobre Slurm 24.05, consulte las siguientes publicaciones:
La configuración de Slurm se puede cambiar en PCS AWS
-
El
SuspendTime
valor predeterminado es.60
Utilice el parámetro descaleDownIdleTimeInSeconds
configuración AWS PCS para configurarlo. Para obtener más información, consulte elscaleDownIdleTimeInSeconds
parámetro del tipo deClusterSlurmConfiguration
datos en la referencia de la API de AWS PCS. -
El
MaxJobCount
yMaxArraySize
se basa en el tamaño que elija para el clúster. Para obtener más información, consulte elsize
parámetro de la acción de laCreateCluster
API en la referencia de la API de AWS PCS. -
La configuración predeterminada de
SelectTypeParameters
Slurm es.CR_CPU
Puede proporcionarlo como un valor para configurarloslurmCustomSettings
al crear un clúster. Para obtener más información, consulte elslurmCustomSettings
parámetro de la acción de laCreateCluster
API y SlurmCustomSettingen la Referencia de la API de AWS PCS. -
Puede configurar
Prolog
yEpilog
a nivel de clúster. Puede proporcionarlo como un valorslurmCustomSettings
para configurarlo al crear un clúster. Para obtener más información, consulteCreateCluster
y SlurmCustomSettingen la referencia de la API de AWS PCS. -
Puede configurar
Weight
yRealMemory
a nivel de grupo de nodos de cómputo. Puede proporcionarlo como un valor para configurarloslurmCustomSettings
al crear un grupo de nodos de procesamiento. Para obtener más información, consultaCreateComputeNodeGroup
y consulta SlurmCustomSettingla referencia de la API de AWS PCS.