Amazon NovaEntendendo os hiperparâmetros de personalização do modelo - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Amazon NovaEntendendo os hiperparâmetros de personalização do modelo

Os Amazon Nova Pro modelosAmazon Nova Lite,Amazon Nova Micro, e oferecem suporte aos três hiperparâmetros a seguir para personalização do modelo. Para obter mais informações, consulte Personalizar o modelo para melhorar a performance para o caso de uso.

Para obter informações sobre o ajuste fino dos modelos Amazon Nova, consulte Modelos de ajuste fino Amazon Nova.

O número de épocas que você especifica aumenta o custo de personalização do modelo ao processar mais tokens. Cada época processa todo o conjunto de dados de treinamento uma vez. Para obter mais informações sobre preços, consulte Preços do Amazon Bedrock.

Hiperparâmetro (console) Hiperparâmetro (API) Definição Tipo Mínimo Máximo Padrão
Epochs epochCount O número de iterações em todo o conjunto de dados de treinamento integer 1 5 2
Taxa de aprendizado learningRate A taxa em que os parâmetros do modelo são atualizados após cada lote flutuação 1,00E-6 1.00E-4 1,00E-5
Etapas de aquecimento da taxa de aprendizado learningRateWarmupEtapas O número de iterações necessárias para que a taxa de aprendizado seja aumentada gradualmente na taxa especificada integer 0 100 10

O número de época padrão é 2, o que funciona na maioria dos casos. Em geral, conjuntos de dados maiores exigem menos épocas para convergir, enquanto conjuntos de dados menores exigem mais épocas para convergir. Uma convergência mais rápida também pode ser alcançada aumentando a taxa de aprendizado, mas isso é menos desejável porque pode levar à instabilidade do treinamento na convergência. Recomendamos começar com os hiperparâmetros padrão, que se baseiam em nossa avaliação em tarefas de diferentes complexidades e tamanhos de dados.

A taxa de aprendizado aumentará gradualmente até o valor definido durante o aquecimento. Portanto, recomendamos que você evite um grande valor de aquecimento quando a amostra de treinamento for pequena, pois a taxa de aprendizado pode nunca atingir o valor definido durante o processo de treinamento. Recomendamos definir as etapas de aquecimento dividindo o tamanho do conjunto de dados por 640 paraAmazon Nova Micro, 160 para e 320 paraAmazon Nova Lite. Amazon Nova Pro