As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Implante modelos JumpStart usando o Amazon SageMaker Studio
As etapas a seguir mostram como implantar modelos JumpStart usando o Amazon SageMaker Studio.
Pré-requisitos
Verifique se você configurou recursos de inferência em seus SageMaker HyperPod clusters da Amazon. Para obter mais informações, consulte Configurando seus HyperPod clusters para implantação de modelos.
Crie uma HyperPod implantação
-
No Amazon SageMaker Studio, abra a JumpStartpágina inicial no painel de navegação esquerdo.
-
Em Todos os modelos públicos, escolha um modelo que você deseja implantar.
nota
Se você selecionou um modelo fechado, precisará aceitar o Contrato de Licença de Usuário Final (EULA).
-
Selecione SageMaker HyperPod.
-
Em Configurações de implantação, JumpStart recomendará uma instância para implantação. Você pode modificar essas configurações, se necessário.
-
Se você modificar o tipo de instância, verifique se ela é compatível com o HyperPod cluster escolhido. Se não houver nenhuma instância compatível, você precisará selecionar um novo HyperPod cluster ou entrar em contato com seu administrador para adicionar instâncias compatíveis ao cluster.
-
Para priorizar a implantação do modelo, instale o complemento de governança de tarefas, crie alocações de computação e configure classificações de tarefas para a política de cluster. Feito isso, você verá uma opção para selecionar uma prioridade para a implantação do modelo, que pode ser usada para antecipar outras implantações e tarefas no cluster.
-
Insira o namespace ao qual seu administrador lhe forneceu acesso. Talvez seja necessário entrar em contato diretamente com seu administrador para obter o namespace exato. Depois que um namespace válido for fornecido, o botão Implantar deverá estar ativado para implantar o modelo.
-
-
Escolha Deploy e aguarde a criação do Endpoint.
-
Depois que o Endpoint for criado, selecione Testar inferência.
Editar uma HyperPod implantação
-
No Amazon SageMaker Studio, selecione Computação e, em seguida, HyperPodclusters no painel de navegação esquerdo.
-
Em Implantações, escolha a implantação do HyperPod cluster que você deseja modificar.
-
No ícone de reticências verticais (₽), escolha Editar.
-
Em Configurações de implantação, você pode ativar ou desativar o escalonamento automático e alterar o número máximo de réplicas.
-
Selecione Salvar.
-
O status mudará para Atualização. Depois que ele voltar para Em serviço, suas alterações serão concluídas e você verá uma mensagem confirmando isso.
Excluir uma HyperPod implantação
-
No Amazon SageMaker Studio, selecione Computação e, em seguida, HyperPodclusters no painel de navegação esquerdo.
-
Em Implantações, escolha a implantação do HyperPod cluster que você deseja modificar.
-
No ícone de reticências verticais (preferences), escolha Excluir.
-
Na janela Excluir HyperPod implantação, marque a caixa de seleção.
-
Escolha Excluir.
-
O status mudará para Excluindo. Depois que a HyperPod implantação for excluída, você verá uma mensagem confirmando isso.