HyperPod에서 Slurm 클러스터를 생성하기 전에 JSON 구성 파일을 검증합니다. - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

HyperPod에서 Slurm 클러스터를 생성하기 전에 JSON 구성 파일을 검증합니다.

클러스터 생성 요청을 제출하기 전에 JSON 구성 파일을 검증하려면 구성 검증 스크립트 validate-config.py를 사용합니다. 이 스크립트는 HyperPod 클러스터 구성 JSON 파일과 Slurm 구성 JSON 파일을 구문 분석하고 비교하며, 두 파일 간에 리소스 구성이 잘못되었는지 여부를 식별하고 Amazon EC2, Amazon VPC 및 Amazon FSx 리소스에서도 식별합니다. 예를 들어 HyperPod에서 제공하는 기본 수명 주기 스크립트로 시작합니다. 섹션의 create_cluster.jsonprovisioning_parameters.json 파일을 검증하려면 다음과 같이 검증 스크립트를 실행합니다.

python3 validate-config.py --cluster-config create_cluster.json --provisioning-parameters provisioning_parameters.json

다음은 성공적인 검증의 예시 출력입니다.

✔️ Validated instance group name worker-group-1 is correct ... ✔️ Validated subnet subnet-012345abcdef67890 ... ✔️ Validated security group sg-012345abcdef67890 ingress rules ... ✔️ Validated security group sg-012345abcdef67890 egress rules ... ✔️ Validated FSx Lustre DNS name fs-012345abcdef67890.fsx.us-east-1.amazonaws.com ✔️ Validated FSx Lustre mount name abcdefgh ✅ Cluster Validation succeeded