As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Ajustar um modelo XGBoost
O ajuste automático de modelos, também conhecido como ajuste de hiperparâmetros, localiza a melhor versão de um modelo executando vários trabalhos que testam uma série de hiperparâmetros no seu conjunto de dados de treinamento e validação. Você escolhe três tipos de hiperparâmetros:
-
uma função de
objective
de aprendizado para otimizar durante o treinamento de modelo -
uma
eval_metric
para usar para avaliar a performance do modelo durante a validação -
um conjunto de hiperparâmetros e um intervalo de valores para cada para usar ao ajustar o modelo automaticamente
Você escolhe a métrica de avaliação do conjunto de métricas de avaliação que o algoritmo calcula. O ajuste de modelo automático pesquisa os hiperparâmetros escolhidos para encontrar a combinação de valores que resultam no modelo que otimiza a métrica de avaliação.
nota
O ajuste automático do modelo para o XGBoost 0.90 está disponível somente nos SageMaker SDKs da Amazon, não no console. SageMaker
Para mais informações sobre o ajuste de modelos, consulte Execute o ajuste automático do modelo com SageMaker.
Métricas de avaliação calculadas pelo algoritmo XGBoost
O algoritmo XGBoost calcula as seguintes métricas para usar na validação do modelo. Ao ajustar o modelo, escolha uma destas métricas para avaliar o modelo. Para obter uma lista completa dos valores válidos de eval_metric
, consulte Parâmetros de tarefa de aprendizado do XGBoost
Nome da métrica | Descrição | Direção de otimização |
---|---|---|
validation:accuracy |
Taxa de classificação, calculada como #(right)/#(all cases). |
Maximizar |
validation:auc |
Área sob a curva. |
Maximizar |
validation:error |
Taxa de erro de classificação binária, calculada como #(casos errados)/#(todos os casos). |
Minimizar |
validation:f1 |
Indicador de precisão de classificação, calculado como a média harmônica de precisão e recall. |
Maximizar |
validation:logloss |
Verossimilhança de log negativa. |
Minimizar |
validation:mae |
Erro absoluto médio. |
Minimizar |
validation:map |
Precisão média da média. |
Maximizar |
validation:merror |
Taxa de erro de classificação multiclasse, calculada como #(casos errados)/#(todos os casos). |
Minimizar |
validation:mlogloss |
Verossimilhança de log negativa para classificação multiclasse. |
Minimizar |
validation:mse |
Erro quadrático médio. |
Minimizar |
validation:ndcg |
Ganho cumulativo descontado normalizado. |
Maximizar |
validation:rmse |
Erro quadrático médio da raiz |
Minimizar |
Hiperparâmetros ajustáveis de XGBoost
Ajuste o modelo XGBoost com os seguintes hiperparâmetros. Os hiperparâmetros que têm o maior efeito na otimização das métricas de avaliação do XGBoost são: alpha
, min_child_weight
, subsample
, eta
e num_round
.
Nome do parâmetro | Tipo de parâmetro | Intervalos recomendados |
---|---|---|
alpha |
ContinuousParameterIntervalos |
MinValue: 0, MaxValue 100 |
colsample_bylevel |
ContinuousParameterIntervalos |
MinValue: 0,1, MaxValue: 1 |
colsample_bynode |
ContinuousParameterIntervalos |
MinValue: 0,1, MaxValue: 1 |
colsample_bytree |
ContinuousParameterIntervalos |
MinValue: 0,5, MaxValue: 1 |
eta |
ContinuousParameterIntervalos |
MinValue: 0,1, MaxValue 0,5 |
gamma |
ContinuousParameterIntervalos |
MinValue: 0, MaxValue 5 |
lambda |
ContinuousParameterIntervalos |
MinValue: 0, MaxValue 100 |
max_delta_step |
IntegerParameterIntervalos |
[0, 10] |
max_depth |
IntegerParameterIntervalos |
[0, 10] |
min_child_weight |
ContinuousParameterIntervalos |
MinValue: 0, MaxValue 120 |
num_round |
IntegerParameterIntervalos |
[1, 4000] |
subsample |
ContinuousParameterIntervalos |
MinValue: 0,5, MaxValue: 1 |