Ajustar um modelo XGBoost - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Ajustar um modelo XGBoost

O ajuste automático de modelos, também conhecido como ajuste de hiperparâmetros, localiza a melhor versão de um modelo executando vários trabalhos que testam uma série de hiperparâmetros no seu conjunto de dados de treinamento e validação. Você escolhe três tipos de hiperparâmetros:

  • uma função de objective de aprendizado para otimizar durante o treinamento de modelo

  • uma eval_metric para usar para avaliar a performance do modelo durante a validação

  • um conjunto de hiperparâmetros e um intervalo de valores para cada para usar ao ajustar o modelo automaticamente

Você escolhe a métrica de avaliação do conjunto de métricas de avaliação que o algoritmo calcula. O ajuste de modelo automático pesquisa os hiperparâmetros escolhidos para encontrar a combinação de valores que resultam no modelo que otimiza a métrica de avaliação.

nota

O ajuste automático do modelo para o XGBoost 0.90 está disponível somente nos SageMaker SDKs da Amazon, não no console. SageMaker

Para mais informações sobre o ajuste de modelos, consulte Execute o ajuste automático do modelo com SageMaker.

Métricas de avaliação calculadas pelo algoritmo XGBoost

O algoritmo XGBoost calcula as seguintes métricas para usar na validação do modelo. Ao ajustar o modelo, escolha uma destas métricas para avaliar o modelo. Para obter uma lista completa dos valores válidos de eval_metric, consulte Parâmetros de tarefa de aprendizado do XGBoost

Nome da métrica Descrição Direção de otimização
validation:accuracy

Taxa de classificação, calculada como #(right)/#(all cases).

Maximizar

validation:auc

Área sob a curva.

Maximizar

validation:error

Taxa de erro de classificação binária, calculada como #(casos errados)/#(todos os casos).

Minimizar

validation:f1

Indicador de precisão de classificação, calculado como a média harmônica de precisão e recall.

Maximizar

validation:logloss

Verossimilhança de log negativa.

Minimizar

validation:mae

Erro absoluto médio.

Minimizar

validation:map

Precisão média da média.

Maximizar

validation:merror

Taxa de erro de classificação multiclasse, calculada como #(casos errados)/#(todos os casos).

Minimizar

validation:mlogloss

Verossimilhança de log negativa para classificação multiclasse.

Minimizar

validation:mse

Erro quadrático médio.

Minimizar

validation:ndcg

Ganho cumulativo descontado normalizado.

Maximizar

validation:rmse

Erro quadrático médio da raiz

Minimizar

Hiperparâmetros ajustáveis de XGBoost

Ajuste o modelo XGBoost com os seguintes hiperparâmetros. Os hiperparâmetros que têm o maior efeito na otimização das métricas de avaliação do XGBoost são: alpha, min_child_weight, subsample, eta e num_round.

Nome do parâmetro Tipo de parâmetro Intervalos recomendados
alpha

ContinuousParameterIntervalos

MinValue: 0, MaxValue 100

colsample_bylevel

ContinuousParameterIntervalos

MinValue: 0,1, MaxValue: 1

colsample_bynode

ContinuousParameterIntervalos

MinValue: 0,1, MaxValue: 1

colsample_bytree

ContinuousParameterIntervalos

MinValue: 0,5, MaxValue: 1

eta

ContinuousParameterIntervalos

MinValue: 0,1, MaxValue 0,5

gamma

ContinuousParameterIntervalos

MinValue: 0, MaxValue 5

lambda

ContinuousParameterIntervalos

MinValue: 0, MaxValue 100

max_delta_step

IntegerParameterIntervalos

[0, 10]

max_depth

IntegerParameterIntervalos

[0, 10]

min_child_weight

ContinuousParameterIntervalos

MinValue: 0, MaxValue 120

num_round

IntegerParameterIntervalos

[1, 4000]

subsample

ContinuousParameterIntervalos

MinValue: 0,5, MaxValue: 1