Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Configurar los complementos de filtro CLI de Slurm en un AWS clúster de PCS
Configure los complementos de filtro CLI al crear un nuevo clúster de AWS PCS. Puede habilitar o deshabilitar los complementos de filtro CLI en los clústeres existentes mediante la API de actualización o la consola sin volver a crear el clúster.
Requisitos previos
Antes de configurar los complementos de filtro CLI, complete estas tareas:
-
Escriba y pruebe un script de Lua que implemente la API del complemento CLI Filter
-
Asigne un nombre exacto a su script de Lua
cli_filter.lua -
Elija un método para implementar el script en todas las instancias del clúster (AMI, S3 o sistema de archivos)
-
Compruebe que utiliza la versión 24.11 o posterior de Slurm
Habilitar los complementos de filtro CLI en un clúster nuevo
Implementar scripts del complemento de filtro CLI
Para implementar scripts del complemento de filtro CLI en su clúster
-
Asegúrese de que todos los que AMIs se utilizan en los grupos de nodos de cómputo tengan Slurm instalado mediante el instalador AWS PCS Slurm.
nota
Si usa la AMI de muestra de AWS PCS para todos los grupos de nodos de cómputo, omita este paso. Slurm ya está instalado.
-
Implemente su
cli_filter.luascript/etc/aws/pcs/scheduler/slurm-<version>/cli_filter.luaen todas las instancias del clúster.Por ejemplo, para la versión 24.11 de Slurm:
/etc/aws/pcs/scheduler/slurm-24.11/cli_filter.lua -
Inicie todos los nodos de inicio de sesión y cálculo con el que esté preparado. AMIs
-
Pruebe el envío del trabajo para verificar que el complemento de filtro CLI se ejecute correctamente.
Habilitar o deshabilitar los complementos de filtro CLI en los clústeres existentes
Puede habilitar o deshabilitar los complementos de filtro CLI en los clústeres existentes sin necesidad de reconstruir la infraestructura. Para obtener más información, consulte Actualización de un clúster en AWS PCS.
Resultados esperados
Después de completar la configuración:
-
El clúster se crea con el complemento de filtro CLI activado
-
Los envíos de trabajos activan su lógica de validación personalizada antes de llegar al controlador Slurm
-
Los trabajos no conformes se rechazan con tus mensajes de error personalizados
-
Los trabajos que cumplen con los requisitos se procesan normalmente a través del programador Slurm
Resolución de problemas
- Falta el script del complemento de filtro CLI en ningún nodo
-
Síntomas: El envío del trabajo falla inmediatamente y se produce un error al cargar el plugin.
Causa probable: el script no se implementó en todas las instancias o la ruta o el nombre del archivo son incorrectos.
Solución: compruebe que el script existe en la ruta correcta en todos los nodos de inicio de sesión y procesamiento con el nombre de archivo exacto
cli_filter.lua. - Configuración del complemento de filtro CLI no válida
-
Síntomas: la creación del clúster falla debido a un error de validación.
Causa probable: el
CliFilterPluginsparámetro no está configurado paracli_filter/luaformatear.Resolución: utilice el valor exacto del parámetro
cli_filter/luaenslurmCustomSettings.