Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Le réglage de modèle automatique, ou réglage d'hyperparamètre, détecte la meilleure version d'un modèle en exécutant plusieurs tâches qui testent une plage d'hyperparamètres sur votre jeu de données. Vous choisissez les hyperparamètres réglables, une plage de valeurs pour chacun d'eux et une métrique d'objectif. Vous choisissez la métrique d'objectif parmi les métriques que calcule l'algorithme. Le réglage de modèle automatique recherche parmi les hyperparamètres choisis la combinaison de valeurs qui produira un modèle permettant d'optimiser la métrique d'objectif.
L'algorithme LDA est un algorithme de modélisation de rubrique non supervisé qui tente de décrire un ensemble d'observations (documents) sous forme d'une combinaison de différentes catégories (rubriques). La métrique PWLL (« per-word log-likelihood ») mesure la probabilité qu'un ensemble appris de rubriques (modèle LDA) décrive avec précision un jeu de documents de test. Les valeurs élevées de PWLL indiquent que les données de test sont plus susceptibles d'être décrites par le modèle LDA.
Pour plus d'informations sur le réglage de modèle, consultez Réglage automatique du modèle grâce à l' SageMaker IA.
Métriques calculées par l'algorithme LDA
L'algorithme LDA rapporte sur une seule métrique pendant la formation : test:pwll
. Lors du réglage d'un modèle, choisissez cette métrique comme métrique d'objectif.
Nom de la métrique | Description | Orientation de l'optimisation |
---|---|---|
test:pwll |
Métrique PWLL sur le jeu de données de test. La probabilité que le jeu de données de test soit décrit précisément par le modèle LDA appris. |
Agrandir |
Hyperparamètres LDA réglables
Vous pouvez régler les hyperparamètres suivants pour l'algorithme LDA. Les deux hyperparamètres, alpha0
et num_topics
, peuvent affecter la métrique d'objectif LDA (test:pwll
). Si vous ignorez les valeurs optimales de ces hyperparamètres, qui maximisent la métrique PWLL et créent un modèle LDA précis, le réglage automatique du modèle peut aider à les trouver.
Nom du paramètre | Type de paramètre | Plages recommandées |
---|---|---|
alpha0 |
ContinuousParameterRanges |
MinValue: 0,1, MaxValue 10 |
num_topics |
IntegerParameterRanges |
MinValue: 1, MaxValue 150 |