Visualizza lo stato della coda di lavoro - AWS Batch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Visualizza lo stato della coda di lavoro

Dopo aver creato una coda di lavoro e aver inviato i lavori, è importante poterne monitorare l'avanzamento. Puoi utilizzare la pagina dei dettagli del lavoro per rivedere, gestire e monitorare la tua coda di lavoro.

Visualizza le informazioni sulla coda di lavoro

Dalla AWS Batch console, seleziona Job queues nel riquadro di navigazione e scegli la coda lavori desiderata per visualizzarne i dettagli. In questa pagina, puoi esaminare e gestire la tua coda di lavoro e visualizzare informazioni aggiuntive sulle operazioni della coda di lavoro, come l'istantanea della coda dei lavori, i limiti dello stato dei lavori, l'ordine dell'ambiente, i tag e il codice JSON della coda dei lavori.

Dettagli della coda di lavoro

Questa sezione fornisce una panoramica e le opzioni di manutenzione per la coda dei lavori. È importante notare che puoi trovare l'Amazon Resource Name (ARN) in questa sezione.

Per trovare queste informazioni tramite AWS Command Line Interface, utilizzare l'DescribeJobQueuesoperazione insieme al nome della coda di lavoro o all'ARN corrispondente.

Istantanea della coda dei lavori

Questa sezione fornisce un elenco statico dei primi 100 RUNNABLE lavori in coda. È possibile utilizzare il campo di ricerca per restringere l'elenco cercando informazioni da qualsiasi colonna della sezione dei risultati. I lavori nell'area dei risultati delle istantanee vengono ordinati in base alla strategia di esecuzione della coda dei lavori. Per le code di lavoro first-in-first-out (FIFO), l'ordine dei lavori si basa sull'orario di invio. Per una programmazione equa delle code di lavoro, l'ordine dei lavori si basa sulla priorità dei lavori e sulla condivisione dell'utilizzo.

Poiché i risultati sono un'istantanea della coda dei lavori, l'elenco dei risultati non viene aggiornato automaticamente. Per aggiornare l'elenco, scegli l'aggiornamento nella parte superiore della sezione. Scegli il collegamento ipertestuale del nome del lavoro per accedere ai dettagli del lavoro e visualizzare lo stato del lavoro e altre informazioni correlate.

Per trovare queste informazioni tramite AWS CLI, utilizzate l'GetJobQueueSnapshotoperazione insieme al nome della coda di lavoro o all'ARN corrispondente.

aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq

Limiti dello stato del lavoro

Utilizza questa scheda per esaminare le informazioni di configurazione relative al periodo di tempo in cui un lavoro può rimanere in uno RUNNABLE stato prima di essere annullato.

Per trovare queste informazioni tramite AWS CLI, utilizzate l'DescribeJobQueuesoperazione insieme al nome della coda di lavoro o all'ARN corrispondente.

Ordine ambientale

Se la coda dei lavori viene eseguita in più ambienti, questa scheda fornisce l'ordine e una panoramica.

Per trovare queste informazioni tramite AWS CLI, utilizzate l'DescribeJobQueuesoperazione insieme al nome della coda di lavoro o all'ARN corrispondente.

Tag

Utilizzate questa scheda per rivedere e gestire i tag associati a questa coda di lavori.

JSON

Utilizza questa scheda per copiare il codice JSON associato a questa coda di lavori. Puoi quindi riutilizzare il JSON per AWS CloudFormation modelli e script. AWS CLI

Monitora i lavori di assistenza

È possibile monitorare lo stato dei lavori di assistenza nella coda dei lavori utilizzando diversi AWS Batch comandi. I job di servizio sono processi eseguiti su AWS servizi come SageMaker Training, dove AWS Batch fornisce funzionalità di pianificazione e accodamento mentre il servizio di destinazione gestisce l'esecuzione dei lavori.

Elenca i lavori di assistenza per stato

Utilizza l'ListServiceJobsoperazione per visualizzare i lavori di assistenza nella coda filtrati per stato. I lavori di assistenza possono avere i seguenti stati:

  • SUBMITTED- Il lavoro è stato inviato ma non ancora elaborato

  • PENDING- Job in sospeso e in attesa di risorse

  • RUNNABLE- Job pronto per l'esecuzione e in attesa in coda

  • STARTING- Job è in fase di avvio

  • RUNNING- Job è attualmente in esecuzione

  • SCHEDULED- Il lavoro è stato inviato al servizio di destinazione ma non è ancora in esecuzione

  • SUCCEEDED- Job completato con successo

  • FAILED- Job non completato

Visualizza i lavori in esecuzione nella tua coda:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING

Visualizza i lavori in attesa in coda:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNABLE

Visualizza i lavori che sono stati inviati SageMaker ma non ancora in esecuzione:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SCHEDULED

Visualizza tutti i lavori eseguiti con successo:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SUCCEEDED

Visualizza i lavori non riusciti per la risoluzione dei problemi:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status FAILED

Filtra i lavori di assistenza

È possibile filtrare i lavori di assistenza per nome utilizzando il pattern matching. Se il valore di un filtro termina con un asterisco (*), corrisponde a qualsiasi nome di lavoro che inizia con la stringa che precede '*'.

Trovate offerte di lavoro con nome che inizia per «formazione»:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --filters name=JOB_NAME,values=training*

Trova lavori con nomi specifici:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --filters name=JOB_NAME,values=my-training-job-1,my-training-job-2

Combina filtri di stato e nome:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING \ --filters name=JOB_NAME,values=production*

Gestisci set di risultati di grandi dimensioni

Quando hai molti lavori di assistenza, utilizza l'impaginazione per gestire i risultati in modo efficace.

Limita il numero di risultati restituiti:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --max-results 10

Usa il token successivo per ottenere risultati aggiuntivi:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --max-results 10 \ --next-token eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9...

Ottieni informazioni dettagliate sulle mansioni di assistenza

Utilizzate l'DescribeServiceJoboperazione per ottenere informazioni complete su una specifica mansione di servizio, tra cui lo stato corrente, gli identificatori delle risorse di servizio e informazioni dettagliate sui tentativi.

Visualizza informazioni dettagliate su un lavoro specifico:

aws batch describe-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d

Questo comando restituisce informazioni complete sul lavoro, tra cui:

  • Job ARN e stato attuale

  • Identificatori delle risorse del servizio (ad esempio SageMaker Training job ARN)

  • Priorità di pianificazione e configurazione dei nuovi tentativi

  • Payload della richiesta di servizio contenente i parametri di servizio originali

  • Informazioni dettagliate sui tentativi con orari di inizio e fine

  • Messaggi di stato dal servizio di destinazione

Monitora i lavori di SageMaker formazione

Quando si monitorano i lavori di SageMaker formazione tramite AWS Batch, è possibile accedere sia alle informazioni sulla AWS Batch mansione sia ai dettagli relativi ai lavori di SageMaker formazione sottostanti.

L'identificatore della risorsa di servizio nei dettagli del lavoro contiene l'ARN del lavoro di SageMaker formazione:

{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }

Puoi utilizzare questo ARN per ottenere ulteriori dettagli direttamente da: SageMaker

aws sagemaker describe-training-job \ --training-job-name my-training-job

Monitora l'avanzamento del lavoro controllando sia AWS Batch lo stato del lavoro che lo stato del lavoro di SageMaker formazione. Lo stato del AWS Batch lavoro mostra il ciclo di vita complessivo del lavoro, mentre lo stato del lavoro di SageMaker formazione fornisce dettagli specifici del servizio sul processo di formazione.

Interrompere i lavori di assistenza

Utilizzare l'TerminateServiceJoboperazione per interrompere un processo di servizio in esecuzione.

Termina un lavoro di servizio specifico:

aws batch terminate-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d \ --reason "Job terminated by user request"

Quando si termina un lavoro di servizio, AWS Batch interrompe il lavoro e invia una notifica al servizio di destinazione. Per i lavori di SageMaker formazione, ciò interromperà anche il lavoro di formazione nell' SageMaker intelligenza artificiale.