Criar clusters do SageMaker HyperPod usando modelos do CloudFormation - Amazon SageMaker AI

Criar clusters do SageMaker HyperPod usando modelos do CloudFormation

Você pode criar clusters do SageMaker HyperPod usando os modelos do CloudFormation para o HyperPod. Você deve instalar a AWS CLI para continuar.

Configurar recursos no console e implantar usando o CloudFormation

Você pode configurar recursos usando o Console de gerenciamento da AWS e implantar usando os modelos do CloudFormation.

Siga estas etapas.

  1. Em vez de escolher Enviar, escolha Baixar parâmetros do modelo do CloudFormation no final do tutorial em Conceitos básicos do SageMaker HyperPod usando o console do SageMaker AI. O tutorial contém informações de configuração importantes das quais você precisará para criar o cluster com êxito.

    Importante

    Se você escolher Enviar, não poderá implantar um cluster com o mesmo nome enquanto não excluir o cluster.

    Depois de escolher Baixar parâmetros do modelo do CloudFormation, a janela Usar o arquivo de configuração para criar o cluster usando a AWS CLI aparecerá no lado direito da página.

  2. Na janela Usar o arquivo de configuração para criar o cluster usando a AWS CLI, escolha Baixar arquivo de parâmetros de configuração. O arquivo será baixado na sua máquina. Você pode editar o arquivo JSON de configuração com base nas suas necessidades ou deixá-lo como está, se nenhuma alteração for necessária.

  3. Em um terminal, navegue até o local do arquivo de parâmetro file://params.json.

  4. Execute o comando create-stack da AWS CLI para implantar a pilha do CloudFormation que provisionará os recursos configurados e criará o cluster do HyperPod.

    aws cloudformation create-stack --stack-name my-stack --template-url https://aws-sagemaker-hyperpod-cluster-setup.amazonaws.com/templates-slurm/main-stack-slurm-based-template.yaml --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  5. Para visualizar o status do provisionamento de recursos, navegue até o console do CloudFormation.

    Após a conclusão da criação do cluster, visualize o novo cluster em Clusters no painel principal do console do SageMaker HyperPod. Você pode conferir o status exibido na coluna Status.

  6. Depois que o status do cluster mudar para InService, você poderá começar a fazer login nos nós do cluster. Para acessar os nós do cluster e começar a executar workloads de ML, consulte Trabalhos em clusters do SageMaker HyperPod.

Configurar e implantar recursos usando o CloudFormation.

Você pode configurar e implantar recursos usando os modelos do CloudFormation para o SageMaker HyperPod.

Siga estas etapas.

  1. Baixe um modelo do CloudFormation para o SageMaker HyperPod no repositório sagemaker-hyperpod-cluster-setup do GitHub.

  2. Execute o comando create-stack da AWS CLI para implantar a pilha do CloudFormation que provisionará os recursos configurados e criará o cluster do HyperPod.

    aws cloudformation create-stack --stack-name my-stack --template-url URL_of_the_file_that_contains_the_template_body --parameters file://params.json --capabilities CAPABILITY_IAM CAPABILITY_NAMED_IAM
  3. Para visualizar o status do provisionamento de recursos, navegue até o console do CloudFormation.

    Após a conclusão da criação do cluster, visualize o novo cluster em Clusters no painel principal do console do SageMaker HyperPod. Você pode conferir o status exibido na coluna Status.

  4. Depois que o status do cluster mudar para InService, você poderá começar a fazer login nos nós do cluster.