awsbsub - AWS ParallelCluster

awsbsub

Envia trabalhos para a fila de trabalhos do cluster.

awsbsub [-h] [-jn JOB_NAME] [-c CLUSTER] [-cf] [-w WORKING_DIR] [-pw PARENT_WORKING_DIR] [-if INPUT_FILE] [-p VCPUS] [-m MEMORY] [-e ENV] [-eb ENV_DENYLIST] [-r RETRY_ATTEMPTS] [-t TIMEOUT] [-n NODES] [-a ARRAY_SIZE] [-d DEPENDS_ON] [command] [arguments [arguments ...]]
Importante

O AWS ParallelCluster não é compatível com trabalhos de GPU para o AWS Batch. Para obter mais informações, consulte Trabalhos de GPU.

Argumentos posicionais

command

Envia o trabalho (o comando especificado deve estar disponível nas instâncias de computação) ou o nome do arquivo a ser transferido. Consulte também --command-file.

arguments

(Opcional) Especifica argumentos para o comando ou arquivo de comando.

Argumentos nomeados

-jn JOB_NAME, --job-name JOB_NAME

Nomeia a tarefa. O primeiro caractere deve ser uma letra ou um número. O nome do trabalho pode conter letras (minúsculas e maiúsculas), números, hifens e sublinhados, e ter até 128 caracteres de comprimento.

-c CLUSTER, --cluster CLUSTER

Especifica o cluster a ser usado.

-cf, --command-file

Indica que o comando é um arquivo a ser transferido para as instâncias de computação.

Padrão: False

-w WORKING_DIR, --working-dir WORKING_DIR

Especifica a pasta a ser usada como diretório de trabalho da tarefa. Se um diretório de trabalho não for especificado, o trabalho será executado na subpasta job-<AWS_BATCH_JOB_ID> do diretório inicial do usuário. Você pode usar esse parâmetro ou o parâmetro --parent-working-dir.

-pw PARENT_WORKING_DIR, --parent-working-dir PARENT_WORKING_DIR

Especifica a pasta pai do diretório de trabalho da tarefa. Se um diretório de trabalho pai não for especificado, o padrão será o diretório inicial do usuário. Uma subpasta chamada job-<AWS_BATCH_JOB_ID> será criada no diretório de trabalho pai. Você pode usar esse parâmetro ou o parâmetro --working-dir.

-if INPUT_FILE, --input-file INPUT_FILE

Especifica o arquivo a ser transferido para as instâncias de computação, no diretório de trabalho do trabalho. Você pode especificar vários parâmetros de arquivo de entrada.

-p VCPUS, --vcpus VCPUS

Especifica o número de vCPUs a serem reservadas para o contêiner. Quando usado em conjunto com –nodes, ele identifica o número de vCPUs para cada nó.

Padrão: 1

-m MEMORY, --memory MEMORY

Especifica o limite rígido de memória (em MiB) a ser fornecido para a tarefa. Se o trabalho tentar exceder o limite de memória especificado aqui, ele será encerrado.

Padrão: 128

-e ENV, --env ENV

Especifica uma lista separada por vírgulas dos nomes das variáveis de ambiente a serem exportadas para o ambiente da tarefa. Para exportar todas as variáveis de ambiente, especifique "all". Observe que uma lista de variáveis de ambiente "all" não inclui as listadas no parâmetro –env-blacklist, nem variáveis que começam com os prefixos PCLUSTER_* e AWS_*.

-eb ENV_DENYLIST, --env-blacklist ENV_DENYLIST

Especifica uma lista separada por vírgulas dos nomes das variáveis de ambiente a não serem exportadas para o ambiente da tarefa. Por padrão, HOME, PWD, USER, PATH, LD_LIBRARY_PATH, TERM e TERMCAP não são exportadas.

-r RETRY_ATTEMPTS, --retry-attempts RETRY_ATTEMPTS

Especifica o número de vezes que um trabalho será movido para o status RUNNABLE. Você pode especificar entre 1 e 10 tentativas. Se o valor de tentativas for maior que 1, o trabalho será repetido se falhar, até ser movido para um status RUNNABLE esse número especificado de vezes.

Padrão: 1

-t TIMEOUT, --timeout TIMEOUT

Especifica duração em segundos (contando a partir do timestamp startedAt da tentativa de trabalho) após a qual o AWS Batch encerrará seu trabalho caso não tenha sido concluído. O valor de tempo limite deve ser pelo menos 60 segundos.

-n NODES, --nodes NODES

Especifica o número de nós a serem reservados para a tarefa. Especifique um valor para esse parâmetro a fim de habilitar o envio paralelo com vários nós.

nota

Quando o parâmetro Scheduler / AwsBatchQueues / CapacityType é definido como SPOT, trabalhos paralelos de vários nós não são suportados. Além disso, deve haver uma função AWSServiceRoleForEC2Spot vinculada ao serviço em sua conta. Você pode criar essa função com o comando de AWS CLI a seguir:

$ aws iam create-service-linked-role --aws-service-name spot.amazonaws.com

Para ter mais informações, consulte Função vinculada ao serviço para solicitações de instâncias spot no Guia do usuário do Amazon Elastic Compute Cloud para instâncias do Linux.

-a ARRAY_SIZE, --array-size ARRAY_SIZE

Indica o tamanho da matriz. Você pode especificar um valor entre 2 e 10.000. Se você especificar propriedades de matriz para uma tarefa, ela se torna uma tarefa de matriz.

-d DEPENDS_ON, --depends-on DEPENDS_ON

Especifica uma lista de dependências separadas por ponto-e-vírgula para uma tarefa. Uma tarefa pode depender de, no máximo, outras 20 tarefas. Você pode especificar um tipo de dependência SEQUENTIAL sem especificar um ID de trabalho para trabalhos de matriz. Uma dependência sequencial permite que cada tarefa filho da matriz seja concluída sequencialmente, a partir do índice 0. Você também pode especificar uma dependência do tipo N_TO_N com um ID de tarefa para tarefas de matriz. Uma dependência N_TO_N significa que cada índice filho dessa tarefa precisa aguardar que o índice filho correspondente de cada dependência seja concluído antes de poder começar. A sintaxe desse parâmetro é "jobId=<string>,type=<string>;...".