Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Hiperparámetros de LightGBM
La siguiente tabla contiene el subconjunto de hiperparámetros que se requieren o se utilizan con más frecuencia para el algoritmo LightGBM de Amazon SageMaker AI. Los usuarios establecen estos parámetros para facilitar la estimación de los parámetros del modelo a partir de los datos. El algoritmo SageMaker AI LightGBM es una implementación del paquete LightGBM de código abierto.
nota
Los hiperparámetros predeterminados se basan en conjuntos de datos de ejemplo de Ejemplos de cuadernos LightGBM.
De forma predeterminada, el algoritmo SageMaker AI LightGBM elige automáticamente una métrica de evaluación y una función objetivo en función del tipo de problema de clasificación. El algoritmo LightGBM detecta el tipo de problema de clasificación a partir del número de etiquetas en los datos. Para los problemas de regresión, la métrica de evaluación es la raíz del error cuadrático medio y la función objetivo es la pérdida L2. Para los problemas de clasificación binaria, la métrica de evaluación y la función objetivo son la entropía cruzada binaria. Para los problemas de clasificación multiclase, la métrica de evaluación es la entropía cruzada multiclase y la función objetivo es softmax. Puede usar el hiperparámetro metric
para cambiar la métrica de evaluación predeterminada. Consulte la siguiente tabla para obtener más información sobre los hiperparámetros en LightGBM, lo que incluye las descripciones, los valores válidos y los valores predeterminados.
Nombre del parámetro | Descripción |
---|---|
num_boost_round |
El número máximo de iteraciones de potenciación. Nota: Internamente, LightGBM construye árboles Valores válidos: entero positivo. Valor predeterminado: |
early_stopping_rounds |
El entrenamiento se detendrá si una métrica de un punto de datos de validación no mejora en la última ronda Valores válidos: número entero Valor predeterminado: |
metric |
Métricas de evaluación de los datos de validación. Si
Valores válidos: cadena, valores Valor predeterminado: |
learning_rate |
La velocidad a la que se actualizan los pesos del modelo después de pasar por cada lote de ejemplos de entrenamiento. Valores válidos: flotante, rango ( Valor predeterminado: |
num_leaves |
El número máximo de hojas de un árbol. Valores válidos: entero, rango ( Valor predeterminado: |
feature_fraction |
Un subconjunto de características que se seleccionarán en cada iteración (árbol). Debe ser menos de 1,0. Valores válidos: flotante, rango ( Valor predeterminado: |
bagging_fraction |
Un subconjunto de características similar a Valores válidos: flotante, rango ( Valor predeterminado: |
bagging_freq |
La frecuencia con la que se realiza el bagging. En cada iteración de Valores válidos: número entero no negativo. Valor predeterminado: |
max_depth |
La profundidad máxima de un modelo de árbol. Se utiliza para tratar el sobreajuste cuando la cantidad de datos es pequeña. Si Valores válidos: número entero Valor predeterminado: |
min_data_in_leaf |
La cantidad mínima de datos en una hoja. Se puede utilizar para hacer frente al sobreajuste. Valores válidos: número entero no negativo. Valor predeterminado: |
max_delta_step |
Se usa para limitar la producción máxima de hojas de árboles. Si Valores válidos: número flotante Valor predeterminado: |
lambda_l1 |
Regularización L1. Valores válidos: número flotante no negativo. Valor predeterminado: |
lambda_l2 |
Regularización L2. Valores válidos: número flotante no negativo. Valor predeterminado: |
boosting |
Tipo de potenciación Valores válidos: cadena ( Valor predeterminado: |
min_gain_to_split |
La ganancia mínima para realizar una división. Se puede utilizar para acelerar el entrenamiento. Valores válidos: número flotante no negativo. Valor predeterminado: |
scale_pos_weight |
La ponderación de las etiquetas con clase positiva. Se usa solo para tareas de clasificación binaria. Valores válidos: número flotante positivo. Valor predeterminado: |
tree_learner |
Tipo de aprendiz en árbol. Valores válidos: cadena ( Valor predeterminado: |
feature_fraction_bynode |
Seleccione un subconjunto de características aleatorias en cada nodo del árbol. Por ejemplo, si Valores válidos: entero, rango [ Valor predeterminado: |
is_unbalance |
Se establece en Valores válidos: cadena ( Valor predeterminado: |
max_bin |
El número máximo de contenedores utilizados para los valores de las características. de buckets. Un número reducido de contenedores puede reducir la precisión del entrenamiento, pero puede aumentar el rendimiento general. Se puede utilizar para hacer frente al sobreajuste. Valores válidos: entero, rango (1, ∞). Valor predeterminado: |
tweedie_variance_power |
Controla la varianza de la distribución de Tweedie. Colóquelo más cerca de Valores válidos: flotante, con el rango [ Valor predeterminado: |
num_threads |
Número de subprocesos paralelos utilizados para ejecutar LightGBM. El valor 0 indica el número predeterminado de subprocesos en OpenMP. Valores válidos: número entero no negativo. Valor predeterminado: |
verbosity |
La verbosidad de los mensajes de impresión. Si Valores válidos: número entero Valor predeterminado: |