Réglage de modèle automatique avec SageMaker - Amazon SageMaker

Réglage de modèle automatique avec SageMaker

Le réglage de modèle automatique Amazon SageMaker, également appelé réglage des hyperparamètres, détecte la meilleure version d'un modèle en exécutant de nombreuses tâches d'entraînement sur votre jeu de données à l'aide de l'algorithme et de plages d'hyperparamètres que vous spécifiez. Elle choisit ensuite les valeurs d'hyperparamètres qui génèrent un modèle avec des performances optimales, telles qu'elles sont mesurées par une métrique que vous choisissez.

Par exemple, supposons que vous souhaitez résoudre un problème de classification binaire sur un ensemble de données marketing. Votre objectif est d'optimiser la zone sous la courbe (auc) de l'algorithme en entraînant un modèle Algorithme XGBoost. Vous ne savez pas quelles valeurs des hyperparamètres eta, alpha, min_child_weight et max_depth utiliser pour entraîner le meilleur modèle. Pour trouver les meilleures valeurs de ces hyperparamètres, vous pouvez spécifier des plages de valeurs que le réglage d'hyperparamètres SageMaker traite pour trouver la combinaison de valeurs qui se traduit par la tâche d'entraînement la plus performante, telle que mesurée selon la métrique d'objectif choisie. Le réglage d'hyperparamètres lance des tâches d'entraînement qui utilisent les valeurs des hyperparamètres dans les plages que vous avez spécifiées, et il renvoie la tâche d'entraînement avec la zone sous la courbe la plus importante.

Vous pouvez utiliser le réglage de modèle automatique SageMaker avec des algorithmes intégrés, des algorithmes personnalisés et des conteneurs SageMaker préintégrés pour les cadres de machine learning.

Le réglage automatique de modèle Amazon SageMaker peut utiliser l'instance Spot Amazon EC2 pour optimiser les coûts lors de l'exécution de tâches d'entraînement. Pour plus d'informations sur l'entraînement Spot géré, veuillez consulter Entraînement d'instances Spot gérées dans Amazon SageMaker.

Avant de commencer à utiliser le réglage des hyperparamètres, vous devez disposer d'un problème de machine learning bien défini, y compris les éléments suivants :

  • Un ensemble de données

  • Une compréhension du type d'algorithme à entraîner

  • Une bonne compréhension de la façon dont vous mesurez la réussite

Vous devez également préparer votre jeu de données et votre algorithme afin qu'ils fonctionnent dans SageMaker et exécutent au moins une fois une tâche d'entraînement. Pour de plus amples informations sur la configuration et l'exécution d'une tâche d'entraînement, reportez-vous à la section Mise en route avec Amazon SageMaker.