Régler un BlazingText modèle - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Régler un BlazingText modèle

Le réglage de modèle automatique, ou réglage d'hyperparamètre, détecte la meilleure version d'un modèle en exécutant plusieurs tâches qui testent une plage d'hyperparamètres sur votre jeu de données. Vous choisissez les hyperparamètres réglables, une plage de valeurs pour chacun d'eux et une métrique d'objectif. Vous choisissez la métrique d'objectif parmi les métriques que calcule l'algorithme. Le réglage de modèle automatique recherche parmi les hyperparamètres choisis la combinaison de valeurs qui produira un modèle permettant d'optimiser la métrique d'objectif.

Pour plus d'informations sur le réglage de modèle, consultez Effectuez le réglage automatique du modèle avec SageMaker.

Métriques calculées par l' BlazingTextalgorithme

L'algorithme BlazingText Word2Vec (skipgram,cbow, et batch_skipgram modes) rend compte d'une seule métrique pendant l'entraînement :. train:mean_rho Cette métrique est calculée sur les ensembles de données de similarité lexicale de WS-353. Utilisez cette métrique comme objectif lors du réglage des valeurs d'hyperparamètres pour l'algorithme Word2vec.

L'algorithme de classification de BlazingText texte (supervisedmode) rend également compte d'une seule métrique pendant l'entraînement : levalidation:accuracy. Utilisez ces métriques comme objectif lors du réglage des valeurs d'hyperparamètres pour l'algorithme de classification textuelle.

Nom de la métrique Description Orientation de l'optimisation
train:mean_rho

Corrélation (rhô) moyenne (coefficient de corrélation de Spearman) pour les ensembles de données de similarité lexicale de WS-353.

Agrandir

validation:accuracy

Précision de la classification pour l'ensemble de données de validation spécifié par l'utilisateur

Agrandir

Hyperparamètres réglables BlazingText

Hyperparamètres réglables pour l'algorithme Word2vec

Réglez un modèle Amazon SageMaker BlazingText Word2Vec avec les hyperparamètres suivants. Les hyperparamètres ayant le plus grand impact sur les métriques d'objectif Word2vec sont les suivants : mode, learning_rate, window_size, vector_dim et negative_samples.

Nom du paramètre Type de paramètre Plages ou valeurs recommandées
batch_size

IntegerParameterRange

[8-32]

epochs

IntegerParameterRange

[5-15]

learning_rate

ContinuousParameterRange

MinValue: 0,005, MaxValue 0,01

min_count

IntegerParameterRange

[0-100]

mode

CategoricalParameterRange

['batch_skipgram', 'skipgram', 'cbow']

negative_samples

IntegerParameterRange

[5-25]

sampling_threshold

ContinuousParameterRange

MinValue: 0,0001, MaxValue : 0,001

vector_dim

IntegerParameterRange

[32-300]

window_size

IntegerParameterRange

[1-10]

Hyperparamètres réglables pour l'algorithme de classification textuelle

Réglez un modèle de classification de SageMaker BlazingText texte Amazon avec les hyperparamètres suivants.

Nom du paramètre Type de paramètre Plages ou valeurs recommandées
buckets

IntegerParameterRange

[1 000 000-10 000 000]

epochs

IntegerParameterRange

[5-15]

learning_rate

ContinuousParameterRange

MinValue: 0,005, MaxValue 0,01

min_count

IntegerParameterRange

[0-100]

vector_dim

IntegerParameterRange

[32-300]

word_ngrams

IntegerParameterRange

[1-3]