本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 HyperPod 上建立 Slurm 叢集之前,請先驗證 JSON 組態檔案
若要在提交叢集建立請求之前驗證 JSON 組態檔案,請使用組態驗證指令碼 validate-config.py
create_cluster.json
和 provisioning_parameters.json
檔案,請執行驗證指令碼,如下所示。
python3 validate-config.py --cluster-config
create_cluster.json
--provisioning-parametersprovisioning_parameters.json
以下是成功驗證的範例輸出。
✔️ Validated instance group name worker-group-1 is correct ... ✔️ Validated subnet subnet-012345abcdef67890 ... ✔️ Validated security group sg-012345abcdef67890 ingress rules ... ✔️ Validated security group sg-012345abcdef67890 egress rules ... ✔️ Validated FSx Lustre DNS name fs-012345abcdef67890.fsx.us-east-1.amazonaws.com ✔️ Validated FSx Lustre mount name abcdefgh ✅ Cluster Validation succeeded