Bloc-notes Amazon SageMaker Autopilot générés pour gérer des tâches AutoML - Amazon SageMaker

Bloc-notes Amazon SageMaker Autopilot générés pour gérer des tâches AutoML

Amazon SageMaker Autopilot gère les tâches clés selon un processus de machine learning automatique (AutoML). Ils sont mis en œuvre par Autopilot avec une tâche AutoML. La tâche AutoML crée deux blocs-notes qui décrivent le plan suivi par Autopilot pour générer des modèles candidats. Un modèle candidat se compose d'une paire (pipeline, algorithme). Premièrement, un bloc-notes d'exploration de données décrit ce qu'Autopilot a appris sur les données que vous avez fournies. Deuxièmement, un bloc-notes de définition de candidats utilise ces informations sur les données pour générer des candidats.

Vous pouvez exécuter les deux blocs-notes dans Amazon SageMaker ou localement si vous avez installé le kit SDK Amazon SageMaker Python. Vous pouvez partager les blocs-notes comme n'importe quel autre bloc-notes SageMaker Studio. Les blocs-notes sont créés pour vous permettre de réaliser des expériences. Par exemple, vous pouvez modifier les éléments suivants dans les blocs-notes :

  • Les préprocesseurs utilisés sur les données

  • Le nombre d'exécutions d'optimisation des hyperparamètres et leur parallélisme

  • Les algorithmes à essayer

  • Les types d'instance utilisés pour les tâches d'optimisation des hyperparamètres

  • Les plages des hyperparamètres

Nous vous recommandons d'utiliser les modifications apportées au bloc-notes de définition des candidats comme outil d'apprentissage. Cette fonctionnalité vous permet de comprendre l'impact des décisions prises au cours du processus de machine learning sur vos résultats.

Note

Lorsque vous exécutez les blocs-notes dans votre instance par défaut, cela entraîne des coûts de référence. Mais lorsque vous exécutez des tâches HPO à partir du bloc-notes de candidat, ces tâches utilisent des ressources de calcul supplémentaires qui entraînent des coûts supplémentaires.