Hiperparámetros de LDA - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Hiperparámetros de LDA

En la solicitud CreateTrainingJob, especifique el algoritmo de capacitación. También puede especificar hiperparámetros específicos del algoritmo como mapas. string-to-string En la siguiente tabla se enumeran los hiperparámetros del algoritmo de entrenamiento LDA proporcionado por Amazon. SageMaker Para obtener más información, consulte Funcionamiento de LDA.

Nombre del parámetro Descripción
num_topics

El número de temas de LDA para buscar en los datos.

Obligatorio

Valores válidos: número entero positivo

feature_dim

El tamaño del vocabulario del cuerpo de documentos de entrada.

Obligatorio

Valores válidos: número entero positivo

mini_batch_size

El número total de documentos en el cuerpo de documentos de entrada.

Obligatorio

Valores válidos: número entero positivo

alpha0

Suposición inicial del parámetro de concentración: la suma de los elementos de Dirichlet anterior. Es más probable que los valores pequeños generen combinaciones de temas dispersos y los valores grandes (superiores a 1,0) generen combinaciones más uniformes.

Opcional

Valores válidos: número flotante positivo

Valor predeterminado: 1.0

max_restarts

El número de reinicios que realizar durante la fase de descomposición espectral de mínimos cuadrados alternantes (ALS) del algoritmo. Se puede utilizar para buscar mejor el mínimo local de calidad a costa de una computación adicional, pero normalmente no debe ajustarse.

Opcional

Valores válidos: número entero positivo

Valor predeterminado: 10

max_iterations

El número máximo de iteraciones que realizar durante la fase ALS del algoritmo. Se puede utilizar para buscar mejor el mínimo de calidad a costa de una computación adicional, pero normalmente no debe ajustarse.

Opcional

Valores válidos: número entero positivo

Valor predeterminado: 1000

tol

Tolerancia a errores del destino para la fase ALS del algoritmo. Se puede utilizar para buscar mejor el mínimo de calidad a costa de una computación adicional, pero normalmente no debe ajustarse.

Opcional

Valores válidos: número flotante positivo

Valor predeterminado: 1e-8