Ajustar um modelo IP Insights - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Ajustar um modelo IP Insights

O ajuste de modelo automático, também chamado de ajuste de hiperparâmetros, localiza a melhor versão de um modelo executando vários trabalhos que testam uma série de hiperparâmetros no seu conjunto de dados. Você escolhe os hiperparâmetros ajustáveis, um intervalo de valores para cada um e uma métrica objetiva. Você escolhe a métrica objetiva entre as métricas que o algoritmo calcula. O ajuste de modelo automático pesquisa os hiperparâmetros escolhidos para encontrar a combinação de valores que resultam no modelo que otimiza a métrica objetiva.

Para mais informações sobre o ajuste de modelos, consulte Execute o ajuste automático do modelo com SageMaker.

Métricas calculadas pelo algoritmo IP Insights

O algoritmo Amazon SageMaker IP Insights é um algoritmo de aprendizado não supervisionado que aprende associações entre endereços IP e entidades. O algoritmo treina um modelo discriminador, que aprende a separar pontos de dados observados (amostras positivas) de pontos de dados gerados aleatoriamente (amostras negativas). O ajuste automático do modelo no IP Insights ajuda a encontrar o modelo capas de distinguir com mais precisão entre dados de validação não rotulados e amostras negativas automaticamente geradas. A precisão do modelo no conjunto de dados de validação é medida pela área sob a curva de característica de operação do receptor. Essa métrica validation:discriminator_auc pode ter valores entre 0,0 e 1,0, em que 1,0 indica precisão perfeita.

O algoritmo IP Insights computa uma métrica validation:discriminator_auc durante a validação, cujo valor é usado como a função objetiva para otimizar o ajuste de hiperparâmetros.

Nome da métrica Descrição Direção de otimização
validation:discriminator_auc

Área sob a curva de característica de operação do receptor no conjunto de dados de validação. O conjunto de dados de validação não é rotulado. A área sob a curva (AUC) é uma métrica que descreve a capacidade do modelo de discriminar pontos de dados de validação usando pontos de dados gerados aleatoriamente.

Maximizar

Hiperparâmetros ajustáveis do IP Insights

Você pode ajustar os seguintes hiperparâmetros para o algoritmo SageMaker IP Insights.

Nome do parâmetro Tipo de parâmetro Intervalos recomendados
epochs

IntegerParameterRange

MinValue: 1, MaxValue 10

learning_rate

ContinuousParameterRange

MinValue: 1e-4, MaxValue: 0,1

mini_batch_size

IntegerParameterRanges

MinValue: 100, MaxValue 50000

num_entity_vectors

IntegerParameterRanges

MinValue: 10000, MaxValue 1000000

num_ip_encoder_layers

IntegerParameterRanges

MinValue: 1, MaxValue 10

random_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue 10

shuffled_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue 10

vector_dim

IntegerParameterRanges

MinValue: 8, MaxValue 256

weight_decay

ContinuousParameterRange

MinValue: 0,0, MaxValue 1,0