Hiperparâmetros das máquinas de fatoração - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Hiperparâmetros das máquinas de fatoração

A tabela a seguir contém os hiperparâmetros para o algoritmo de máquinas de fatoração. Esses parâmetros são definidos pelos usuários para facilitar a estimativa dos parâmetros do modelo a partir dos dados. Os hiperparâmetros necessários que devem ser definidos são listados primeiro, em ordem alfabética. Os hiperparâmetros opcionais que podem ser configurados são listados em seguida, também em ordem alfabética.

Nome do parâmetro Descrição
feature_dim

A dimensão do espaço do recurso de entrada. Esse parâmetro pode ser muito alto com entradas esparsas.

Obrigatório

Valores válidos: inteiro positivo. Intervalo de valores sugerido: [10000,10000000]

num_factors

A dimensionalidade da fatoração.

Obrigatório

Valores válidos: inteiro positivo. Faixa de valores sugerida: [2.1000], 64 normalmente gera bons resultados e é um bom ponto de partida.

predictor_type

O tipo de previsor.

  • binary_classifier: Para tarefas de classificação binária.

  • regressor: Para tarefas de regressão.

Obrigatório

Valores válidos: String: binary_classifier ou regressor

bias_init_method

O método de inicialização do termo de polarização:

  • normal: Inicializa os pesos com amostras de valores aleatórios provenientes de uma distribuição normal com média zero e desvio padrão especificado por bias_init_sigma.

  • uniform: inicializa os pesos com amostras uniformes de valores aleatórios provenientes de um intervalo especificado por [bias_init_scale, +bias_init_scale].

  • constant: inicializa os pesos para um valor escalar especificado por bias_init_value.

Opcional

Valores válidos: uniform, normal ou constant

Valor padrão: normal

bias_init_scale

Intervalo para a inicialização dos termos de desvio. Entrará em vigor se bias_init_method estiver definido como uniform.

Opcional

Valores válidos: flutuante não negativo. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: Nenhum

bias_init_sigma

O desvio padrão para a inicialização dos termos de polarização. Entrará em vigor se bias_init_method estiver definido como normal.

Opcional

Valores válidos: flutuante não negativo. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: 0,01

bias_init_value

O valor inicial do termo de polarização. Entrará em vigor se bias_init_method estiver definido como constant.

Opcional

Valores válidos: flutuante. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: Nenhum

bias_lr

A taxa de aprendizagem do termo de polarização.

Opcional

Valores válidos: flutuante não negativo. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: 0.1

bias_wd

A degradação de peso para o termo de polarização.

Opcional

Valores válidos: flutuante não negativo. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: 0,01

clip_gradient

Parâmetro otimizador de recorte de gradiente. Corta o gradiente projetando no intervalo [-clip_gradient, +clip_gradient].

Opcional

Valores válidos: Flutuante

Valor padrão: Nenhum

epochs

O número de epochs de treinamento a serem executados.

Opcional

Valores válidos: inteiro positivo

Valor padrão: 1

eps

Parâmetro épsilon para evitar divisão por 0.

Opcional

Valores válidos: flutuante. Valor sugerido: pequeno.

Valor padrão: Nenhum

factors_init_method

O método de inicialização para termos de fatoração:

  • normal Inicializa os pesos com amostras de valores aleatórios provenientes de uma distribuição normal com média zero e desvio padrão especificado por factors_init_sigma.

  • uniform: inicializa os pesos com amostras uniformes de valores aleatórios provenientes de um intervalo especificado por [factors_init_scale, +factors_init_scale].

  • constant: inicializa os pesos para um valor escalar especificado por factors_init_value.

Opcional

Valores válidos: uniform, normal ou constant.

Valor padrão: normal

factors_init_scale

O intervalo para inicialização de termos de fatoração. Entrará em vigor se factors_init_method estiver definido como uniform.

Opcional

Valores válidos: flutuante não negativo. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: Nenhum

factors_init_sigma

O desvio padrão para inicialização de termos de fatoração. Entrará em vigor se factors_init_method estiver definido como normal.

Opcional

Valores válidos: flutuante não negativo. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: 0.001

factors_init_value

O valor inicial dos termos de fatoração. Entrará em vigor se factors_init_method estiver definido como constant.

Opcional

Valores válidos: flutuante. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: Nenhum

factors_lr

A taxa de aprendizagem para termos de fatoração.

Opcional

Valores válidos: flutuante não negativo. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: 0.0001

factors_wd

A degradação de peso dos termos de fatoração.

Opcional

Valores válidos: flutuante não negativo. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: 0.00001

linear_lr

A taxa de aprendizagem para termos lineares.

Opcional

Valores válidos: flutuante não negativo. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: 0.001

linear_init_method

O método de inicialização para termos lineares:

  • normal Inicializa os pesos com amostras de valores aleatórios provenientes de uma distribuição normal com média zero e desvio padrão especificado por linear_init_sigma.

  • uniform Inicializa os pesos com amostras uniformes de valores aleatórios provenientes de um intervalo especificado por [linear_init_scale, +linear_init_scale].

  • constant Inicializa os pesos para um valor escalar especificado por linear_init_value.

Opcional

Valores válidos: uniform, normal ou constant.

Valor padrão: normal

linear_init_scale

Intervalo para a inicialização dos termos lineares. Entrará em vigor se linear_init_method estiver definido como uniform.

Opcional

Valores válidos: flutuante não negativo. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: Nenhum

linear_init_sigma

O desvio padrão para inicialização de termos lineares. Entrará em vigor se linear_init_method estiver definido como normal.

Opcional

Valores válidos: flutuante não negativo. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: 0,01

linear_init_value

O valor inicial de termos lineares. Entrará em vigor se linear_init_method estiver definido como constant.

Opcional

Valores válidos: flutuante. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: Nenhum

linear_wd

A degradação de peso para termos lineares.

Opcional

Valores válidos: flutuante não negativo. Intervalo de valores sugerido: [1e-8, 512]

Valor padrão: 0.001

mini_batch_size

O tamanho do minilote usado para treinamento.

Opcional

Valores válidos: inteiro positivo

Valor padrão: 1000

rescale_grad

Parâmetro otimizador de redimensionamento de gradiente. Se definido, multiplicará o gradiente com rescale_grad antes de atualizar. Geralmente, a escolha é 1,0/batch_size.

Opcional

Valores válidos: Flutuante

Valor padrão: Nenhum