Criar clusters do SageMaker HyperPod usando modelos do CloudFormation
Você pode criar clusters do SageMaker HyperPod usando os modelos do CloudFormation para o HyperPod. Você deve instalar a AWS CLI para continuar.
Neste tópico:
Configurar recursos no console e implantar usando o CloudFormation
Você pode configurar recursos usando o Console de gerenciamento da AWS e implantar usando os modelos do CloudFormation.
Siga estas etapas.
-
Em vez de escolher Enviar, escolha Baixar parâmetros do modelo do CloudFormation no final do tutorial em Conceitos básicos do SageMaker HyperPod usando o console do SageMaker AI. O tutorial contém informações de configuração importantes das quais você precisará para criar o cluster com êxito.
Importante
Se você escolher Enviar, não poderá implantar um cluster com o mesmo nome enquanto não excluir o cluster.
Depois de escolher Baixar parâmetros do modelo do CloudFormation, a janela Usar o arquivo de configuração para criar o cluster usando a AWS CLI aparecerá no lado direito da página.
-
Na janela Usar o arquivo de configuração para criar o cluster usando a AWS CLI, escolha Baixar arquivo de parâmetros de configuração. O arquivo será baixado na sua máquina. Você pode editar o arquivo JSON de configuração com base nas suas necessidades ou deixá-lo como está, se nenhuma alteração for necessária.
-
Em um terminal, navegue até o local do arquivo de parâmetro
file://params.json. -
Execute o comando create-stack da AWS CLI para implantar a pilha do CloudFormation que provisionará os recursos configurados e criará o cluster do HyperPod.
aws cloudformation create-stack --stack-namemy-stack--template-urlhttps://aws-sagemaker-hyperpod-cluster-setup.amazonaws.com/templates-slurm/main-stack-slurm-based-template.yaml--parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM -
Para visualizar o status do provisionamento de recursos, navegue até o console do CloudFormation
. Após a conclusão da criação do cluster, visualize o novo cluster em Clusters no painel principal do console do SageMaker HyperPod. Você pode conferir o status exibido na coluna Status.
-
Depois que o status do cluster mudar para
InService, você poderá começar a fazer login nos nós do cluster. Para acessar os nós do cluster e começar a executar workloads de ML, consulte Trabalhos em clusters do SageMaker HyperPod.
Configurar e implantar recursos usando o CloudFormation.
Você pode configurar e implantar recursos usando os modelos do CloudFormation para o SageMaker HyperPod.
Siga estas etapas.
-
Baixe um modelo do CloudFormation para o SageMaker HyperPod no repositório sagemaker-hyperpod-cluster-setup
do GitHub. -
Execute o comando create-stack da AWS CLI para implantar a pilha do CloudFormation que provisionará os recursos configurados e criará o cluster do HyperPod.
aws cloudformation create-stack --stack-namemy-stack--template-urlURL_of_the_file_that_contains_the_template_body--parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM -
Para visualizar o status do provisionamento de recursos, navegue até o console do CloudFormation.
Após a conclusão da criação do cluster, visualize o novo cluster em Clusters no painel principal do console do SageMaker HyperPod. Você pode conferir o status exibido na coluna Status.
-
Depois que o status do cluster mudar para
InService, você poderá começar a fazer login nos nós do cluster.