Crie um SageMaker HyperPod cluster em planos de treinamento usando a SageMaker API ou AWS CLI - SageMaker Inteligência Artificial da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Crie um SageMaker HyperPod cluster em planos de treinamento usando a SageMaker API ou AWS CLI

Para usar planos de SageMaker treinamento para seu SageMaker HyperPod cluster da Amazon, especifique o ARN do plano de treinamento que você deseja usar no TrainingPlanArnparâmetro do ClusterInstanceGroupSpecificationao chamar a operação da CreateClusterAPI.

Certifique-se de que a sub-rede associada à AZ designada do seu plano esteja incluída na configuração VPCConfig do seu cluster. Você pode recuperar o AvailabilityZone de um plano de treinamento em resposta a uma chamada de DescribeTrainingPlanAPI.

O exemplo a seguir ilustra como criar um novo SageMaker HyperPod cluster e fornecer a um grupo de instâncias um plano de treinamento no --instance-groups atributo do create-cluster AWS CLI comando.

# Create a cluster aws sagemaker create-cluster \ --cluster-name cluster-name \ --instance-groups '[ \ { \ "InstanceCount": 1,\ "InstanceGroupName": "controller-nodes",\ "InstanceType": "ml.t3.xlarge",\ "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\ "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\ "ThreadsPerCore": 1,\ },\ { \ "InstanceCount": 2, \ "InstanceGroupName": "worker-nodes",\ "InstanceType": "p4d.24xlarge",\ "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\ "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\ "ThreadsPerCore": 1,\ "TrainingPlanArn": training_plan_arn,\ }]'

Para obter informações sobre como criar um HyperPod cluster usando create-clustero. AWS CLI

Depois de criar o cluster, você pode verificar se a capacidade do plano de treinamento foi atribuída corretamente ao seu grupo de instâncias chamando a DescribeCluster API.

aws sagemaker describe-cluster --cluster-name cluster-name