Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
SageMaker Débogueur Amazon
Déboguez les tenseurs de sortie des modèles issus de tâches de formation au machine learning en temps réel et détectez les problèmes non convergents à l'aide d'Amazon Debugger. SageMaker
Fonctionnalités d'Amazon SageMaker Debugger
Une tâche d'entraînement de machine learning (ML) peut présenter des problèmes tels que des surajustements, la saturation des fonctions d'activation et la disparition des gradients, qui peuvent compromettre les performances du modèle.
SageMaker Debugger fournit des outils pour déboguer les tâches d'entraînement et résoudre ces problèmes afin d'améliorer les performances de votre modèle. Debugger propose également des outils permettant d'envoyer des alertes lorsque des anomalies d'entraînement sont détectées, de prendre des mesures contre les problèmes et d'en identifier la cause racine en visualisant les métriques et les tenseurs collectés.
SageMaker Debugger prend en charge les frameworks Apache MXNet PyTorch, TensorFlow, etXGBoost. Pour plus d'informations sur les frameworks disponibles et les versions prises en charge par SageMaker Debugger, consultez. Frameworks et algorithmes pris en charge
Voici le flux de travail à haut niveau de Debugger :
-
Modifiez votre script d'entraînement avec le
sagemaker-debugger
Python SDK si nécessaire. -
Configurez une tâche SageMaker de formation avec SageMaker Debugger.
-
Configurez à l'aide de l' SageMaker estimateur API (pour PythonSDK).
-
Configurez à l'aide de la SageMaker
CreateTrainingJob
demande (pour Boto3 ouCLI). -
Configurez des conteneurs de formation personnalisés avec SageMaker Debugger.
-
-
Démarrez une tâche d'entraînement et contrôlez les problèmes d'entraînement en temps réel.
-
Recevez des alertes et prenez des mesures rapides contre les problèmes d'entraînement.
-
Recevez des textes et des e-mails et arrêtez les tâches d'entraînement lorsque des problèmes d'entraînement sont détectés à l'aide des Utiliser les actions intégrées du Debugger pour les règles.
-
Configurez vos propres actions à l'aide d'Amazon CloudWatch Events et AWS Lambda.
-
-
Examinez l'analyse approfondie des problèmes d'entraînement.
-
Pour le débogage des tenseurs de sortie de modèle, consultez Visualisez les tenseurs de sortie du débogueur dans TensorBoard.
-
-
Corrigez les problèmes en tenant compte des suggestions fournies par Debugger et répétez les étapes 1 à 5 pour optimiser votre modèle jusqu'à atteindre la précision souhaitée.
Le guide du développeur SageMaker Debugger aborde les sujets suivants.
Rubriques
- Frameworks et algorithmes pris en charge
- Architecture d'Amazon SageMaker Debugger
- Tutoriels de débogage
- Débogage de tâches de formation à l'aide d'Amazon SageMaker Debugger
- Liste des règles intégrées du Debugger
- Création de règles personnalisées à l'aide de la bibliothèque cliente Debugger
- Utiliser Debugger avec des conteneurs de formation personnalisés
- Configurez le débogueur à l'aide de SageMaker API
- Références Amazon SageMaker Debugger