Crie uma fila SageMaker de trabalhos de treinamento em AWS Batch - AWS Batch

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Crie uma fila SageMaker de trabalhos de treinamento em AWS Batch

SageMaker As filas de tarefas de treinamento se integram diretamente ao serviço de SageMaker IA para fornecer agendamento de tarefas sem servidor, sem exigir que você gerencie a infraestrutura computacional subjacente.

Pré-requisitos

Antes de criar uma fila SageMaker de trabalhos de treinamento, verifique se você tem:

Create a SageMaker Training job queue (AWS Batch console)
  1. Abra o AWS Batch console em https://console.aws.amazon.com/batch/.

  2. No painel de navegação, escolha Job queues e Create.

  3. Em Tipo de orquestração, escolha SageMaker Treinamento.

  4. Para configuração da fila de Job:

    1. Em Nome, insira o nome da fila de Job.

    2. em Prioridade, insira um valor entre 0 e 1000. Uma fila de trabalhos com maior prioridade tem preferência para ambientes de serviço.

    3. (Opcional) Para Política de Agendamento do Nome do Recurso da Amazon (ARN), escolha uma política de agendamento existente.

    4. Para Ambientes de serviço conectados, selecione um ambiente de serviço na lista para associar à fila de trabalhos.

  5. (Opcional) Para limites de estado de Job:

    1. Em Configuração incorreta, escolha SERVICE_ENVIRONMENT_MAX_RESOURCE e insira o Tempo máximo de execução (segundos).

    2. Em Capacidade, escolha INSUFFICIENT_INSTANCE_CAPACITY e insira o Tempo máximo de execução (segundos).

  6. Escolha Criar fila de trabalhos

Create a SageMaker Training job queue (AWS CLI)

Use o create-job-queue comando para criar uma fila SageMaker de trabalhos de treinamento.

O exemplo a seguir cria uma fila de trabalhos de SageMaker treinamento básica que usa um ambiente de serviço:

aws batch create-job-queue \ --job-queue-name my-sm-training-fifo-jq \ --job-queue-type SAGEMAKER_TRAINING \ --priority 1 \ --service-environment-order order=1,serviceEnvironment=ExampleServiceEnvironment

ExampleServiceEnvironmentSubstitua pelo nome do seu ambiente de serviço.

Esse comando retorna uma saída semelhante à seguinte:

{ "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq" }

Depois de criar sua fila de trabalhos, verifique se ela foi criada com sucesso e se está em um estado válido.

Use o describe-job-queues comando para ver detalhes sobre sua fila de trabalhos:

aws batch describe-job-queues --job-queues my-sm-training-fifo-jq

Esse comando retorna uma saída semelhante à seguinte:

{ "jobQueues": [ { "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq", "state": "ENABLED", "status": "VALID", "statusReason": "JobQueue Healthy", "priority": 1, "computeEnvironmentOrder": [], "serviceEnvironmentOrder": [ { "order": 1, "serviceEnvironment": "arn:aws:batch:region:account:service-environment/ExampleServiceEnvironment" } ], "jobQueueType": "SAGEMAKER_TRAINING", "tags": {}, "jobStateTimeLimitActions": [] } ] }

Verifique se:

  • O state é ENABLED

  • O status é VALID

  • O statusReason é JobQueue Healthy

  • O jobQueueType é SAGEMAKER_TRAINING

  • As serviceEnvironmentOrder referências ao seu ambiente de serviço