AWS CloudFormation テンプレートを使用した SageMaker HyperPod クラスターの作成 - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS CloudFormation テンプレートを使用した SageMaker HyperPod クラスターの作成

HyperPod の CloudFormation テンプレートを使用して SageMaker HyperPod クラスターを作成できます。続行する AWS CLI には、 をインストールする必要があります。

コンソールでリソースを設定し、CloudFormation を使用してデプロイする

を使用してリソースを設定し AWS Management Console 、CloudFormation テンプレートを使用してデプロイできます。

以下の手順に従ってください。

  1. 「」の手順に従ってSageMaker AI コンソールを使用した SageMaker HyperPod の開始方法、クラスターの作成に必要な AWS リソースを設定します。

  2. クラスターの作成ページの最後に、CloudFormation テンプレートパラメータのダウンロードを選択します。これにより、設定ファイルを使用して、ページの右側にあるウィンドウを使用してクラスターを作成します AWS CLI

  3. 「設定ファイルを使用して ウィンドウを使用してクラスターを作成する」で AWS CLI「設定パラメータファイルのダウンロード」を選択します。ファイルがマシンにダウンロードされます。必要に応じて設定 JSON ファイルを編集することも、変更が必要ない場合はそのままにすることもできます。

  4. create-stack AWS CLI コマンドを実行して、設定されたリソースをプロビジョニングし、HyperPod クラスターを作成する CloudFormation スタックをデプロイします。

    aws cloudformation create-stack --stack-name my-stack --template-url https://aws-sagemaker-hyperpod-cluster-setup.amazonaws.com/templates-slurm/main-stack-slurm-based-template.yaml --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  5. リソースプロビジョニングのステータスを表示するには、CloudFormation コンソールに移動します。

    クラスターの作成が完了したら、SageMaker HyperPod コンソールのメインペインのクラスターの下に新しいクラスターを表示します。ステータスは、[ステータス] 列で確認できます。

  6. クラスターのステータスが InService になったら、クラスターノードへのログインを開始できます。クラスターノードにアクセスして ML ワークロードの実行を開始するには、「SageMaker HyperPod クラスター上のジョブ」を参照してください。

CloudFormation を使用してリソースを設定し、デプロイする

SageMaker HyperPod の CloudFormation テンプレートを使用してリソースを設定し、デプロイできます。

以下の手順に従ってください。

  1. SageMaker HyperPod 用の CloudFormation テンプレートを sagemaker-hyperpod-cluster-setup GitHub リポジトリからダウンロードします。

  2. create-stack AWS CLI コマンドを実行して、設定されたリソースをプロビジョニングし、HyperPod クラスターを作成する CloudFormation スタックをデプロイします。

    aws cloudformation create-stack --stack-name my-stack --template-url URL_of_the_file_that_contains_the_template_body --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  3. リソースプロビジョニングのステータスを表示するには、CloudFormation コンソールに移動します。

    クラスターの作成が完了したら、SageMaker HyperPod コンソールのメインペインのクラスターの下に新しいクラスターを表示します。ステータスは、[ステータス] 列で確認できます。

  4. クラスターのステータスが InService になったら、クラスターノードへのログインを開始できます。クラスターノードにアクセスして ML ワークロードの実行を開始するには、「SageMaker HyperPod クラスター上のジョブ」を参照してください。