Ajustar un modelo LDA - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ajustar un modelo LDA

El ajuste de modelo automático, también conocido como ajuste de hiperparámetros, encuentra la mejor versión de un modelo ejecutando muchas tareas que probar una serie de hiperparámetros en su conjunto de datos. Usted elige los hiperparámetros que pueden ajustarse, un rango de valores para cada uno de ellos y una métrica objetiva. Puede elegir la métrica objetiva de las métricas que el algoritmo computa. El ajuste de modelo automático busca los hiperparámetros elegidos para encontrar la combinación de valores que obtienen el modelo que optimiza la métrica objetiva.

LDA es un algoritmo de modelado de temas no supervisado que intenta describir un conjunto de observaciones (documentos) como una combinación de categorías (temas) distintas. La métrica "probabilidad de registro por palabra" (PWLL) mide la probabilidad de que un conjunto de temas aprendidos (un modelo LDA) describe de forma precisa un conjunto de datos de documento de prueba. Valores más altos de PWLL indican que es más probable que los datos de prueba se describan en el modelo LDA.

Para obtener más información acerca del ajuste de modelos, consulte Realice un ajuste automático del modelo con SageMaker.

Métricas calculadas por el algoritmo LDA

El algoritmo LDA informa sobre en una única métrica durante la capacitación: test:pwll. Al ajustar un modelo, elija esta métrica como la métrica objetivo.

Nombre de métrica Descripción Dirección de optimización
test:pwll

Probabilidad de registro por palabra en el conjunto de datos de prueba. La probabilidad de que el conjunto de datos de prueba sea descrito con exactitud por el modelo aprendido LDA.

Maximizar

Hiperparámetros de LDA ajustables

Puede ajustar los siguientes hiperparámetros para el algoritmo de LDA. Los hiperparámetros alpha0 y num_topics pueden afectar a la métrica objetivo LDA (test:pwll). Si aún no conoce los valores óptimos para estos hiperparámetros, que maximizan la probabilidad de registro por palabra y producen un modelo LDA preciso, un ajuste de modelo LDA automático puede ayudar a encontrarlos.

Nombre del parámetro Tipo de parámetro Intervalos recomendados
alpha0

ContinuousParameterRanges

MinValue: 0.1,: 10 MaxValue

num_topics

IntegerParameterRanges

MinValue: 1, MaxValue 150