Buat SageMaker HyperPod klaster pada rencana pelatihan menggunakan SageMaker API, atau AWS CLI - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Buat SageMaker HyperPod klaster pada rencana pelatihan menggunakan SageMaker API, atau AWS CLI

Untuk menggunakan rencana SageMaker pelatihan untuk SageMaker HyperPod klaster Amazon Anda, tentukan ARN dari rencana pelatihan yang ingin Anda gunakan dalam TrainingPlanArnparameter ClusterInstanceGroupSpecificationsaat memanggil operasi CreateClusterAPI.

Pastikan subnet yang terkait dengan AZ yang ditunjuk dari paket Anda disertakan dalam konfigurasi klaster Anda. VPCConfig Anda dapat mengambil rencana pelatihan dalam respons panggilan DescribeTrainingPlanAPI. AvailabilityZone

Contoh berikut menggambarkan cara membuat SageMaker HyperPod cluster baru dan menyediakan grup instance dengan rencana pelatihan dalam --instance-groups atribut create-cluster AWS CLI perintah.

# Create a cluster aws sagemaker create-cluster \ --cluster-name cluster-name \ --instance-groups '[ \ { \ "InstanceCount": 1,\ "InstanceGroupName": "controller-nodes",\ "InstanceType": "ml.t3.xlarge",\ "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\ "ExecutionRole": "arn:aws:iam::customer_account_id:role/execution_role",\ "ThreadsPerCore": 1,\ },\ { \ "InstanceCount": 2, \ "InstanceGroupName": "worker-nodes",\ "InstanceType": "p4d.24xlarge",\ "LifeCycleConfig": {"SourceS3Uri": source_s3_uri, "OnCreate": "on_create.sh"},\ "ExecutionRole": "arn:aws:iam::customer_account_id}:role/execution_role}",\ "ThreadsPerCore": 1,\ "TrainingPlanArn": training_plan_arn,\ }]'

Untuk informasi selengkapnya tentang cara membuat kluster Pig, lihat .

Setelah membuat klaster, Anda dapat memverifikasi bahwa grup instans Anda telah menetapkan kapasitas dengan benar dari rencana pelatihan dengan memanggil DescribeCluster API.

aws sagemaker describe-cluster --cluster-name cluster-name