Crea una coda SageMaker di lavoro di formazione in AWS Batch - AWS Batch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Crea una coda SageMaker di lavoro di formazione in AWS Batch

SageMaker Le code di lavoro di formazione si integrano direttamente con il servizio di SageMaker intelligenza artificiale per fornire una pianificazione dei lavori senza server senza la necessità di gestire l'infrastruttura di elaborazione sottostante.

Prerequisiti

Prima di creare una coda per i lavori SageMaker di formazione, assicurati di avere:

Create a SageMaker Training job queue (AWS Batch console)
  1. Apri la console all' AWS Batch indirizzo. https://console.aws.amazon.com/batch/

  2. Nel riquadro di navigazione, scegli Job queues e Create.

  3. Per il tipo di orchestrazione, scegli Training. SageMaker

  4. Per la configurazione della coda Job:

    1. Per Nome, immettere il nome della coda Job.

    2. per Priorità, immettete un valore compreso tra 0 e 1000. A una coda Job con una priorità più alta viene data la preferenza per gli ambienti di servizio.

    3. (Facoltativo) Per la politica di pianificazione Amazon Resource Name (ARN), scegli una politica di pianificazione esistente.

    4. Per gli ambienti di servizio connessi, seleziona un ambiente di servizio dall'elenco da associare alla coda di lavoro.

  5. (Facoltativo) Per i limiti dello stato Job:

    1. Per Configurazione errata, scegliete SERVICE_ENVIRONMENT_MAX_RESOURCE e immettete il Tempo massimo di esecuzione (secondi).

    2. Per Capacità, scegli INSUFFICIENT_INSTANCE_CAPACITY e inserisci il Tempo di esecuzione massimo (secondi).

  6. Scegli Crea coda di lavoro

Create a SageMaker Training job queue (AWS CLI)

Usa il create-job-queue comando per creare una coda di lavori SageMaker di formazione.

L'esempio seguente crea una coda di job SageMaker Training di base che utilizza un ambiente di servizio:

aws batch create-job-queue \ --job-queue-name my-sm-training-fifo-jq \ --job-queue-type SAGEMAKER_TRAINING \ --priority 1 \ --service-environment-order order=1,serviceEnvironment=ExampleServiceEnvironment

Sostituire ExampleServiceEnvironment con il nome dell'ambiente di servizio.

Il comando restituisce un output simile al seguente:

{ "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq" }

Dopo aver creato la coda dei lavori, verifica che sia stata creata correttamente e che sia in uno stato valido.

Usa il describe-job-queues comando per visualizzare i dettagli sulla tua coda di lavoro:

aws batch describe-job-queues --job-queues my-sm-training-fifo-jq

Il comando restituisce un output simile al seguente:

{ "jobQueues": [ { "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq", "state": "ENABLED", "status": "VALID", "statusReason": "JobQueue Healthy", "priority": 1, "computeEnvironmentOrder": [], "serviceEnvironmentOrder": [ { "order": 1, "serviceEnvironment": "arn:aws:batch:region:account:service-environment/ExampleServiceEnvironment" } ], "jobQueueType": "SAGEMAKER_TRAINING", "tags": {}, "jobStateTimeLimitActions": [] } ] }

Assicuratevi che:

  • La state è ENABLED

  • La status è VALID

  • La statusReason è JobQueue Healthy

  • La jobQueueType è SAGEMAKER_TRAINING

  • I serviceEnvironmentOrder riferimenti al tuo ambiente di servizio