Régler un modèle RCF - Amazon SageMaker

Régler un modèle RCF

Le réglage de modèle automatique, ou réglage d'hyperparamètre, détecte la meilleure version d'un modèle en exécutant plusieurs tâches qui testent une plage d'hyperparamètres sur votre jeu de données. Vous choisissez les hyperparamètres réglables, une plage de valeurs pour chacun d'eux et une métrique d'objectif. Vous choisissez la métrique d'objectif parmi les métriques que calcule l'algorithme. Le réglage de modèle automatique recherche parmi les hyperparamètres choisis la combinaison de valeurs qui produira un modèle permettant d'optimiser la métrique d'objectif.

L'algorithme RCF d'Amazon SageMaker est un algorithme de détection d'anomalie non supervisé qui nécessite un jeu de données de test étiquetées pour l'optimisation des hyperparamètres. Il calcule les scores d'anomalie dans les points de données de test, puis étiquette les points de données comme anormaux si leurs scores dépassent trois écarts types par rapport à la moyenne. Cette règle s'appelle la règle des trois sigmas. Le score F1 s'appuie sur l'écart entre les étiquettes calculées et les étiquettes réelles. La tâche de réglage des hyperparamètres recherche le modèle qui optimise ce score. La réussite de l'optimisation des hyperparamètres dépend de l'applicabilité de la règle des trois sigmas à l'ensemble de données de test.

Pour plus d'informations sur le réglage de modèle, consultez Réglage de modèle automatique avec SageMaker.

Métriques calculées par l'algorithme RCF

L'algorithme RCF calcule les métriques suivantes au cours de l'entraînement. Lors du réglage du modèle, choisissez cette métrique comme objectif.

Nom de la métrique Description Orientation de l'optimisation
test:f1

Score F1 sur l'ensemble de données de test, basé sur l'écart entre les étiquettes calculées et les étiquettes réelles.

Agrandir

Hyperparamètres RCF réglables

Vous pouvez régler un modèle RCF avec les hyperparamètres suivants.

Nom du paramètre Type de paramètre Plages recommandées
num_samples_per_tree

IntegerParameterRanges

Valeur min. : 1, valeur max. : 2048

num_trees

IntegerParameterRanges

Valeur min. : 50, valeur max. : 1000