Régler un modèle d'apprentissage linéaire - Amazon SageMaker

Régler un modèle d'apprentissage linéaire

Le réglage de modèle automatique, ou réglage d'hyperparamètre, détecte la meilleure version d'un modèle en exécutant plusieurs tâches qui testent une plage d'hyperparamètres sur votre ensemble de données. Vous choisissez les hyperparamètres réglables, une plage de valeurs pour chacun d'eux et une métrique d'objectif. Vous choisissez la métrique d'objectif parmi les métriques que calcule l'algorithme. Le réglage de modèle automatique recherche parmi les hyperparamètres choisis la combinaison de valeurs qui produira un modèle permettant d'optimiser la métrique d'objectif.

L'algorithme d'apprentissage linéaire dispose également d'un mécanisme interne pour régler les hyperparamètres distincts du réglage automatique du modèle décrite ici. Par défaut, l'algorithme d'apprentissage linéaire règle les hyperparamètres via l'entraînement en parallèle de plusieurs modèles. Lorsque vous utilisez le réglage de modèle automatique, le mécanisme de réglage interne de l'apprentissage linéaire est désactivé automatiquement. Le nombre de modèles parallèles, num_models, a ainsi la valeur 1. L'algorithme ignore toute valeur que vous définissez pour num_models.

Pour plus d'informations sur le réglage de modèle, consultez Réglage de modèle automatique avec SageMaker.

Métriques calculées par l'algorithme d'apprentissage linéaire

L'algorithme d'apprentissage linéaire rapporte les métriques dans le tableau suivant ; elles sont calculées au cours de l'entraînement. Choisissez l'une d'entre elles comme métrique d'objectif. Pour éviter un sur-ajustement, nous vous recommandons de régler le modèle par rapport à une métrique de validation au lieu d'une métrique d'entraînement.

Nom de la métrique Description Orientation de l'optimisation
test:objective_loss

Valeur moyenne de la fonction perte (loss) de l'objectif sur le jeu de données de test après que le modèle a été entraîné. Par défaut, la perte est une perte logistique pour la classification binaire et une perte quadratique pour la régression. Pour définir la perte des autres types, utilisez l'hyperparamètre loss.

Réduire

test:binary_classification_ accuracy

Précision du modèle final sur le jeu de données de test.

Agrandir

test:binary_f_beta

Le score F_beta du modèle final sur l'ensemble de données de test. Par défaut, il s'agit du score F1, qui représente la moyenne harmonique de la précision et du rappel.

Agrandir

test:precision

Précision du modèle final sur le jeu de données de test. Si vous choisissez cette métrique comme objectif, nous vous recommandons de définir un rappel de cible en définissant l'hyperparamètre binary_classifier_model_selection avec la valeur precision_at_target_recall et en définissant la valeur de l'hyperparamètre target_recall.

Agrandir

test:recall

Rappel du modèle final sur le jeu de données de test. Si vous choisissez cette métrique comme objectif, nous vous recommandons de définir une précision de cible en définissant l'hyperparamètre binary_classifier_model_selection avec la valeur recall_at_target_precision et en définissant la valeur de l'hyperparamètre target_precision.

Agrandir

validation:objective_loss

Valeur moyenne de la fonction perte de l'objectif sur le jeu de données de validation pour chaque période (epoch). Par défaut, la perte est une perte logistique pour la classification binaire et une perte quadratique pour la régression. Pour définir la perte d'autres types, utilisez l'hyperparamètre loss.

Réduire

validation:binary_classification_accuracy

Précision du modèle final sur le jeu de données de validation.

Agrandir

validation:binary_f_beta

Score F_beta du modèle final sur le jeu de données de validation. Par défaut, le score F_beta est le score F1, qui représente la moyenne harmonique des métriques validation:precision et validation:recall.

Agrandir

validation:precision

Précision du modèle final sur le jeu de données de validation. Si vous choisissez cette métrique comme objectif, nous vous recommandons de définir un rappel de cible en définissant l'hyperparamètre binary_classifier_model_selection avec la valeur precision_at_target_recall et en définissant la valeur de l'hyperparamètre target_recall.

Agrandir

validation:recall

Rappel du modèle final sur le jeu de données de validation. Si vous choisissez cette métrique comme objectif, nous vous recommandons de définir une précision de cible en définissant l'hyperparamètre binary_classifier_model_selection avec la valeur recall_at_target_precision et en définissant la valeur de l'hyperparamètre target_precision.

Agrandir

Réglage des hyperparamètres de l'apprentissage linéaire

Vous pouvez régler un modèle d'apprentissage linéaire avec les hyperparamètres suivants.

Nom du paramètre Type de paramètre Plages recommandées
wd

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

l1

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

learning_rate

ContinuousParameterRanges

MinValue: 1e-5, MaxValue: 1

mini_batch_size

IntegerParameterRanges

MinValue: 100, MaxValue: 5000

use_bias

CategoricalParameterRanges

[True, False]

positive_example_weight_mult

ContinuousParameterRanges

MinValue: 1e-5, MaxValue: 1e5