As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Configurar plug-ins de filtro CLI do Slurm em um cluster PCS AWS
Configure os plug-ins de filtro CLI ao criar um novo cluster AWS PCS. Você pode ativar ou desativar os plug-ins de filtro CLI em clusters existentes usando a API de atualização ou o console sem recriar o cluster.
Pré-requisitos
Antes de configurar os plug-ins de filtro CLI, conclua estas tarefas:
-
Escreva e teste um script Lua que implemente a API CLI Filter Plugin
-
Nomeie seu script Lua com exatidão
cli_filter.lua -
Escolha um método para implantar seu script em todas as instâncias do cluster (AMI, S3 ou sistema de arquivos)
-
Verifique se você está usando o Slurm versão 24.11 ou posterior
Ativar plug-ins de filtro CLI em um novo cluster
Implantar scripts de plug-in de filtro CLI
Para implantar scripts do CLI Filter Plugin em seu cluster
-
Certifique-se de que todos os AMIs usados em grupos de nós de computação tenham o Slurm instalado por meio do instalador do AWS PCS Slurm.
nota
Se você usar o AWS PCS Sample AMI para todos os grupos de nós de computação, pule esta etapa. O Slurm já está instalado.
-
Implante seu
cli_filter.luascript/etc/aws/pcs/scheduler/slurm-<version>/cli_filter.luaem todas as instâncias do cluster.Por exemplo, para a versão 24.11 do Slurm:
/etc/aws/pcs/scheduler/slurm-24.11/cli_filter.lua -
Inicie todos os nós de login e computação usando seu preparado AMIs.
-
Teste o envio do trabalho para verificar se o plug-in de filtro CLI está sendo executado corretamente.
Ativar ou desativar plug-ins de filtro CLI em clusters existentes
Você pode ativar ou desativar os plug-ins de filtro CLI em clusters existentes sem reconstruir sua infraestrutura. Para obter mais informações, consulte Atualizando um cluster no AWS PCS.
Resultados esperados
Depois de concluir a configuração:
-
Seu cluster é criado com o CLI Filter Plugin ativado
-
Os envios de trabalhos acionam sua lógica de validação personalizada antes de chegar ao controlador Slurm
-
Trabalhos não compatíveis são rejeitados com suas mensagens de erro personalizadas
-
Os trabalhos compatíveis prosseguem normalmente por meio do agendador Slurm
Solução de problemas
- Falta o script do plug-in de filtro CLI em qualquer nó
-
Sintomas: O envio do trabalho falha imediatamente com erro de carregamento do plug-in.
Causa provável: script não implantado em todas as instâncias ou nome ou caminho de arquivo incorreto.
Resolução: verifique se o script existe no caminho correto em todos os nós de login e computação com o nome de arquivo
cli_filter.luaexato. - Configuração inválida do plug-in de filtro CLI
-
Sintomas: falha na criação do cluster com erro de validação.
Causa provável:
CliFilterPluginsparâmetro não definido paracli_filter/luaformatar.Resolução: Use o valor exato do parâmetro
cli_filter/luaemslurmCustomSettings.