Exibir detalhes do plano de treinamento - SageMaker Inteligência Artificial da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Exibir detalhes do plano de treinamento

Para monitorar o status ou recuperar detalhes de um plano de treinamento, você pode usar a DescribeTrainingPlanAPI. A resposta da API inclui um Status campo que reflete o estado atual do plano de treinamento:

  • Se a compra do plano falhar, o status será definido comoFailed.

  • Após o pagamento bem-sucedido, o status muda de Pending paraScheduled, com base na data de início do plano.

  • Quando o plano atinge sua data de início, o status muda paraActive.

  • Para planos com várias capacidades reservadas descontínuas, o status reverte para Scheduled entre os períodos ativos, até a data de início da próxima capacidade reservada.

  • Após a data de término do plano, o status passa a serExpired.

Quando o status forScheduled, você poderá utilizar a capacidade reservada no plano para seus trabalhos de SageMaker treinamento ou cargas de trabalho de HyperPod cluster.

nota
  • Os trabalhos de treinamento associados ao plano permanecem em Pending status até que o plano se torneActive.

  • Para HyperPod clusters que usam um plano de treinamento para capacidade computacional, o status do grupo de instâncias aparece como InService uma vez criado.

O exemplo a seguir usa um AWS CLI comando para recuperar os detalhes de um plano de treinamento pelo nome.

aws sagemaker describe-training-plan \ --training-plan-name "name"

Este documento JSON é um exemplo de resposta da API de planos de SageMaker treinamento. Essa resposta fornece detalhes sobre um plano de treinamento que foi criado com sucesso.

{ "AvailableInstanceCount": 2, "CurrencyCode": "USD", "DurationHours": 48, "DurationMinutes": 0, "EndTime": "2024-09-28T04:30:00-07:00", "InUseInstanceCount": 2, "ReservedCapacitySummaries": [ { "AvailabilityZone": "string", "DurationHours": 48, "DurationMinutes": 0, "EndTime": "2024-09-28T04:30:00-07:00", "InstanceType": "ml.p5.48xlarge", "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1", "StartTime": "2024-09-26T04:30:00-07:00", "Status": "Scheduled", "TotalInstanceCount": 4, "UltraServerCount": 4, "UltraServerType": "ml.p6e-gb200.36xlarge" } ], "StartTime": "2024-09-26T04:30:00-07:00", "Status": "Scheduled", "StatusMessage": "Payment confirmed, training plan scheduled." "TargetResources": [ "training-job" ], "TotalInstanceCount": 4, "TotalUltraServerCount": 4, "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning", "TrainingPlanName": "large-models-fine-tuning", "UpfrontFee": "xxxx.xx" }

As seções a seguir definem o parâmetro de solicitação de entrada obrigatório para a operação DescribeTrainingPlan da API.

Parâmetros necessários

  • TrainingPlanName: O nome do plano de treinamento que você deseja descrever.