SageMaker HyperPod referências - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

SageMaker HyperPod referências

Encontre mais informações e referências sobre o uso SageMaker HyperPod nos tópicos a seguir.

SageMaker HyperPod preços

Os tópicos a seguir fornecem informações sobre SageMaker HyperPod preços. Para encontrar mais detalhes sobre o preço por hora do uso de SageMaker HyperPod instâncias, consulte também os SageMaker preços da Amazon.

Solicitações de capacidade

Você pode alocar capacidade computacional sob demanda ou reservada SageMaker para uso em. SageMaker HyperPod A criação de clusters sob demanda aloca a capacidade disponível do pool de capacidade sob SageMaker demanda. Como alternativa, você pode solicitar capacidade reservada para garantir o acesso enviando um ticket para aumentar a cota. As solicitações de capacidade de entrada são priorizadas SageMaker e você recebe um tempo estimado para alocação de capacidade.

Faturamento de serviços

Ao provisionar uma capacidade computacional SageMaker HyperPod, você é cobrado pela duração da alocação de capacidade. SageMaker HyperPod o faturamento aparece em suas faturas de aniversário com um item de linha para o tipo de alocação de capacidade (sob demanda, reservada), o tipo de instância e o tempo gasto no uso da instância.

Para enviar um ticket para um aumento de cota, consulteSageMaker HyperPod cotas.

SageMaker HyperPod APIs

A lista a seguir é um conjunto completo de SageMaker HyperPod APIs para enviar solicitações de ação no formato JSON por meio de SageMaker ou. AWS CLI AWS SDK for Python (Boto3)

SageMaker HyperPod formulários

Para configurar a ferramenta de gerenciamento de carga de trabalho do Slurm HyperPod, você deve criar um arquivo de configuração do Slurm necessário usando HyperPod o formulário fornecido.

Formulário de configuração para provisionamento de nós do Slurm em HyperPod

O código a seguir é o formulário de configuração do Slurm que você deve preparar para configurar adequadamente os nós do Slurm em seu cluster. HyperPod Você deve preencher esse formulário e carregá-lo como parte de um conjunto de scripts de ciclo de vida durante a criação do cluster. Para saber como esse formulário deve ser preparado em todos os processos de criação de HyperPod clusters, consulteSageMaker HyperPod melhores práticas de configuração do ciclo de vida.

// Save as provisioning_params.json. { "version": "1.0.0", "workload_manager": "slurm", "controller_group": "string", "login_group": "string", "worker_groups": [ { "instance_group_name": "string", "partition_name": "string" } ], "fsx_dns_name": "string", "fsx_mountname": "string" }
  • version – obrigatório. Essa é a versão do formulário de parâmetros de HyperPod provisionamento. Guarde para1.0.0.

  • workload_manager – obrigatório. Isso serve para especificar qual gerenciador de carga de trabalho deve ser configurado no HyperPod cluster. Guarde paraslurm.

  • controller_group – obrigatório. Isso serve para especificar o nome do grupo de instâncias do HyperPod cluster que você deseja atribuir ao nó do controlador (principal) do Slurm.

  • login_group: opcional. Isso serve para especificar o nome do grupo de instâncias do HyperPod cluster que você deseja atribuir ao nó de login do Slurm.

  • worker_groups – obrigatório. Isso serve para configurar nós de trabalho (computação) do Slurm no cluster. HyperPod

    • instance_group_name – obrigatório. Isso serve para especificar o nome do grupo de HyperPod instâncias que você deseja atribuir ao nó de trabalho (computação) do Slurm.

    • partition_name – obrigatório. Isso serve para especificar o nome da partição para o nó.

  • fsx_dns_name: opcional. Se você quiser configurar seus nós do Slurm no HyperPod cluster para se comunicar com o Amazon FSx, especifique o nome DNS do FSx.

  • fsx_mountname: opcional. Se você quiser configurar seus nós do Slurm no HyperPod cluster para se comunicar com o Amazon FSx, especifique o nome da montagem do FSx.

SageMaker HyperPod DLAMI

O SageMaker HyperPod agente executa um SageMaker HyperPod DLAMI, que é construído AWS sobre o Deep Learning Base GPU AMI (Ubuntu 20.04).

O SageMaker HyperPod DLAMI vem com pacotes adicionais para oferecer suporte a ferramentas de código aberto, como Slurm e dependências, e pacotes de software de cluster para oferecer suporte a recursos como verificação de integridade SageMaker HyperPod e retomada automática do cluster. Para acompanhar as atualizações de HyperPod software que a equipe de HyperPod serviço distribui por meio do DLAMI, consulte. Notas SageMaker HyperPod de lançamento da Amazon

SageMaker HyperPod Referência de permissões da API

Importante

Políticas personalizadas do IAM que permitem que o Amazon SageMaker SageMaker Studio ou o Amazon Studio Classic criem SageMaker recursos da Amazon também devem conceder permissões para adicionar tags a esses recursos. A permissão para adicionar tags aos recursos é necessária porque o Studio e o Studio Classic marcam automaticamente todos os recursos que eles criam. Se uma política do IAM permitir que o Studio e o Studio Classic criem recursos, mas não permitisse a marcação, erros AccessDenied "" podem ocorrer ao tentar criar recursos. Para ter mais informações, consulte Forneça permissões para marcar recursos SageMaker.

AWS Políticas gerenciadas para a Amazon SageMakerque dão permissões para criar SageMaker recursos já incluem permissões para adicionar tags ao criar esses recursos.

Ao configurar o controle de acesso para permitir a execução de operações de SageMaker HyperPod API e escrever uma política de permissões que você pode anexar aos usuários do IAM para administradores de nuvem, use a tabela a seguir como referência.

Operações de SageMaker API da Amazon Permissões necessárias (Ações da API) Recursos
CreateCluster sagemaker:CreateCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DeleteCluster sagemaker:DeleteCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DescribeCluster sagemaker:DescribeCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DescribeClusterNode sagemaker:DescribeClusterNode arn:aws:sagemaker:region:account-id:cluster/cluster-id
ListClusterNodes sagemaker:ListClusterNodes arn:aws:sagemaker:region:account-id:cluster/cluster-id
ListClusters sagemaker:ListClusters arn:aws:sagemaker:region:account-id:cluster/cluster-id
UpdateCluster sagemaker:UpdateCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
UpdateClusterSoftware sagemaker:UpdateClusterSoftware arn:aws:sagemaker:region:account-id:cluster/cluster-id

Para obter uma lista completa de permissões e tipos de recursos para SageMaker APIs, consulte Ações, recursos e chaves de condição para a Amazon SageMaker na Referência de autorização AWS de serviço.

SageMaker HyperPod comandos em AWS CLI

A seguir estão os AWS CLI comandos SageMaker HyperPod para executar as principais operações HyperPod da API.

SageMaker HyperPod Módulos Python em AWS SDK for Python (Boto3)

A seguir estão os métodos do AWS SDK for Python (Boto3) cliente SageMaker para executar as principais operações HyperPod da API.