Use modelos básicos no Studio - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Use modelos básicos no Studio

Você pode ajustar, implantar e avaliar modelos JumpStart básicos proprietários e disponíveis ao público diretamente por meio da interface do usuário do Amazon SageMaker Studio.

Importante

Em 30 de novembro de 2023, a experiência anterior do Amazon SageMaker Studio agora se chama Amazon SageMaker Studio Classic. A seção a seguir é específica para usar a experiência atualizada do Studio. Para obter informações sobre como usar o aplicativo Studio Classic, consulteAmazon SageMaker Studio Clássico.

No Amazon SageMaker Studio, abra a página JumpStart inicial por meio da página inicial ou do menu inicial no painel do lado esquerdo. Isso abre a página SageMaker JumpStartinicial, na qual você pode explorar os hubs de modelos e pesquisar modelos.

  • Na página inicial, escolha JumpStartno painel Soluções pré-construídas e automatizadas.

  • No menu Início, no painel esquerdo, navegue até o JumpStartnó.

Para obter mais informações sobre como começar a usar o Amazon SageMaker Studio, consulte SageMaker Estúdio Amazon.

Na página SageMaker JumpStartinicial do Studio, você pode explorar hubs de modelos de fornecedores de modelos disponíveis ao público e modelos proprietários. Você pode encontrar hubs ou modelos específicos usando a barra de pesquisa. Dentro de cada hub de modelos, você pode pesquisar modelos diretamente, classificar por Mais curtidas, Mais downloads ou Atualizado recentemente, ou filtrar com base em uma lista de tarefas de modelo fornecidas. Escolha um modelo para ver o cartão de detalhes do modelo. No canto superior direito do cartão de detalhes do modelo, escolha Ajustar, Implantar ou Avaliar para começar a trabalhar com os fluxos de trabalho de ajuste fino, implantação ou avaliação, respectivamente. Observe que nem todos os modelos estão disponíveis para ajuste fino ou avaliação.

Ajuste os modelos de base no Studio

O ajuste fino treina um modelo pré-treinado em um novo conjunto de dados sem precisar ser treinado do zero. Esse processo, também conhecido como aprendizado por transferência, pode produzir modelos precisos com conjuntos de dados menores e menos tempo de treinamento. Para ajustar os modelos JumpStart básicos, navegue até um cartão de detalhes do modelo na interface do usuário do Studio. Para obter mais informações sobre como abrir JumpStart no Studio, consulteAbra e use JumpStart no Studio. Depois de navegar até o cartão de detalhes do modelo de sua escolha, escolha Trem no canto superior direito. Observe que nem todos os modelos têm ajustes finos disponíveis.

Importante

Alguns modelos básicos exigem a aceitação explícita de um contrato de licença de usuário final (EULA) antes de serem ajustados. Para ter mais informações, consulte Aceitação do EULA no Amazon Studio SageMaker .

Configurações do modelo

Ao usar um modelo JumpStart básico pré-treinado no Amazon SageMaker Studio, a localização do artefato do modelo (URI do Amazon S3) é preenchida por padrão. Para editar o URI padrão do Amazon S3, escolha Inserir localização do artefato do modelo. Nem todos os modelos oferecem suporte à alteração da localização do artefato do modelo.

Configurações de dados

No campo Dados, forneça um ponto de URI do Amazon S3 para a localização do seu conjunto de dados de treinamento. O URI padrão do Amazon S3 aponta para um exemplo de conjunto de dados de treinamento. Para editar o URI padrão do Amazon S3, escolha Inserir conjunto de dados de treinamento e altere o URI. Certifique-se de revisar o cartão de detalhes do modelo no Amazon SageMaker Studio para obter informações sobre a formatação dos dados de treinamento.

Hiperparâmetros

Você pode personalizar os hiperparâmetros do trabalho de treinamento que são usados para ajustar o modelo. Os hiperparâmetros disponíveis para cada modelo ajustável diferem dependendo do modelo.

Os seguintes hiperparâmetros são comuns entre os modelos:

  • Épocas – Uma época é um ciclo em todo o conjunto de dados. Vários intervalos completam um lote, e vários lotes eventualmente completam uma época. Várias épocas são executadas até que a precisão do modelo atinja um nível aceitável ou quando a taxa de erro caia abaixo de um nível aceitável.

  • Taxa de aprendizado – A quantidade em que os valores devem ser alterados entre as épocas. À medida que o modelo é refinado, seus pesos internos são ajustados e as taxas de erro são verificadas para ver se o modelo melhora. Uma taxa de aprendizado típica é 0,1 ou 0,01, em que 0,01 é um ajuste muito menor e pode fazer com que o treinamento leve muito tempo para convergir, enquanto 0,1 é muito maior e pode fazer com que o treinamento ultrapasse. É um dos principais hiperparâmetros que você pode ajustar para treinar seu modelo. Observe que, para modelos de texto, uma taxa de aprendizado muito menor (5e-5 para BERT) pode resultar em um modelo mais preciso.

  • Tamanho do lote – O número de registros do conjunto de dados que devem ser selecionados para cada intervalo a serem enviados às GPUs para treinamento.

Analise as dicas de ferramentas e as informações adicionais no cartão de detalhes do modelo na interface do usuário do Studio para saber mais sobre hiperparâmetros específicos do modelo de sua escolha.

Para obter mais informações sobre os hiperparâmetros disponíveis, consulteHiperparâmetros de ajuste fino comumente suportados.

Implantação

Especifique o tipo de instância de treinamento e a localização do artefato de saída para seu trabalho de treinamento. Você só pode escolher entre instâncias que sejam compatíveis com o modelo de sua escolha dentro do ajuste fino da interface do usuário do Studio. A localização padrão do artefato de saída é o bucket SageMaker padrão. Para alterar a localização do artefato de saída, escolha Inserir localização do artefato de saída e altere o URI do Amazon S3.

Segurança

Especifique as configurações de segurança a serem usadas em seu trabalho de treinamento, incluindo a função do IAM SageMaker usada para treinar seu modelo, se seu trabalho de treinamento deve se conectar a uma nuvem privada virtual (VPC) e quaisquer chaves de criptografia para proteger seus dados.

Mais informações

No campo Informações adicionais, você pode editar o nome do trabalho de treinamento. Você também pode adicionar e remover tags na forma de pares de valores-chave para ajudar a organizar e categorizar seus trabalhos de treinamento de ajuste fino.

Depois de fornecer informações para sua configuração de ajuste fino, escolha Enviar. Se o modelo básico pré-treinado que você escolheu ajustar exigir a concordância explícita de um contrato de licença de usuário final (EULA) antes do treinamento, o EULA será fornecido em uma janela pop-up. Para aceitar os termos do EULA, escolha Aceitar. Você é responsável por revisar e cumprir todos os termos de licença aplicáveis e garantir que eles sejam aceitáveis para seu caso de uso antes de baixar ou usar o modelo.

Implemente modelos básicos no Studio

Para implantar modelos JumpStart básicos, navegue até um cartão de detalhes do modelo na interface do usuário do Studio. Para obter mais informações sobre como abrir JumpStart no Studio, consulteAbra e use JumpStart no Studio. Depois de navegar até a página de detalhes do modelo de sua escolha, escolha Implantar no canto superior direito da interface do usuário do Studio. Em seguida, siga as etapas em Implantar modelos com o SageMaker Studio.

Importante

Alguns modelos básicos exigem a aceitação explícita de um contrato de licença de usuário final (EULA) antes da implantação. Para ter mais informações, consulte Aceitação do EULA no Amazon Studio SageMaker .

Avalie os modelos de fundação no Studio

SageMaker JumpStart A Amazon tem integrações com o SageMaker Clarify Foundation Model Evaluations (FME) no Studio. Se um JumpStart modelo tiver recursos de avaliação integrados disponíveis, você poderá escolher Avaliar no canto superior direito da página de detalhes do modelo na interface do usuário do JumpStart Studio. Para obter mais informações, consulte Avaliar um modelo básico.