Bloc-notes Amazon SageMaker Autopilot générés pour gérer des tâches AutoML - Amazon SageMaker

Bloc-notes Amazon SageMaker Autopilot générés pour gérer des tâches AutoML

Amazon SageMaker Autopilot gère les tâches clés selon un processus de machine learning automatique (AutoML). Ils sont mis en œuvre par Autopilot avec une tâche AutoML. La tâche AutoML crée deux rapports basés sur des blocs-notes qui décrivent le plan suivi par Autopilot pour générer des modèles candidats. Un modèle candidat se compose d'une paire (pipeline, algorithme). Premièrement, un bloc-notes d'exploration de données décrit ce qu'Autopilot a appris sur les données que vous avez fournies. Deuxièmement, un bloc-notes de définition de candidats utilise ces informations sur les données pour générer des candidats. Troisièmement, un rapport d'analyse de modèle qui peut aider à détailler les caractéristiques de performance du meilleur modèle dans le classement d'une expérience de pilote automatique.

Vous pouvez exécuter ces blocs-notes dans Amazon SageMaker ou localement si vous avez installé le kit SDK Amazon SageMaker Python. Vous pouvez partager les blocs-notes comme n'importe quel autre bloc-notes SageMaker Studio. Les blocs-notes sont créés pour vous permettre de réaliser des expériences. Par exemple, vous pouvez modifier les éléments suivants dans les blocs-notes :

  • Préprocesseurs utilisés sur les données

  • Nombre d'exécutions d'optimisation des hyperparamètres et leur parallélisme

  • Algorithmes à essayer

  • Types d'instance utilisés pour les tâches d'optimisation des hyperparamètres

  • Plages des hyperparamètres

Les modifications du bloc-notes de définition des candidats sont encouragées en tant qu'outil d'apprentissage. Grâce à cette capacité, vous apprenez comment les décisions prises au cours du processus de machine learning influencent vos résultats.

Note

Lorsque vous exécutez les blocs-notes dans votre instance par défaut, vous payez des coûts de référence. Cependant, lorsque vous exécutez des tâches HPO à partir du bloc-notes des candidats, ces tâches utilisent des ressources de calcul supplémentaires qui entraînent des coûts supplémentaires.