Hyperparamètres LDA - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Hyperparamètres LDA

Dans la demande CreateTrainingJob, vous spécifiez l'algorithme d'entraînement. Vous pouvez aussi spécifier les hyperparamètres spécifiques à l'algorithme comme mappages chaîne/chaîne. Le tableau suivant répertorie les hyperparamètres de l'algorithme d'entraînement LDA fourni par Amazon SageMaker. Pour de plus amples informations, veuillez consulter Fonctionnement de l'algorithme LDA.

Nom du paramètre Description
num_topics

Nombre de rubriques pour le modèle LDA à rechercher dans les données.

Obligatoire

Valeurs valides : nombre entier positif

feature_dim

Taille du vocabulaire du corpus de documents d'entrée.

Obligatoire

Valeurs valides : nombre entier positif

mini_batch_size

Nombre total de documents dans le corpus de documents d'entrée.

Obligatoire

Valeurs valides : nombre entier positif

alpha0

Supposition initiale pour le paramètre de concentration : somme des éléments de l'antécédent Dirichlet. Les petites valeurs sont plus susceptibles de générer des mélanges de rubriques dispersés et les valeurs élevées (supérieures à 1,0), des mélanges uniformes.

Facultatif

Valeurs valides : valeur flottante positive

Valeur par défaut : 1.0

max_restarts

Nombre de redémarrages à exécuter au cours de la phase de décomposition spectrale des moindres carrés alternés (ALS) de l'algorithme. Peut être utilisé pour trouver des minima locaux de meilleure qualité sous condition de calculs supplémentaires, mais ne doit pas être ajusté en général.

Facultatif

Valeurs valides : nombre entier positif

Valeur par défaut : 10

max_iterations

Nombre maximum d'itérations à exécuter au cours de la phase ALS de l'algorithme. Peut être utilisé pour trouver des minima de meilleure qualité sous condition de calculs supplémentaires, mais ne doit pas être ajusté en général.

Facultatif

Valeurs valides : nombre entier positif

Valeur par défaut : 1000

tol

Tolérance d'erreur cible de la phase ALS de l'algorithme. Peut être utilisé pour trouver des minima de meilleure qualité sous condition de calculs supplémentaires, mais ne doit pas être ajusté en général.

Facultatif

Valeurs valides : valeur flottante positive

Valeur par défaut : 1e-8