Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Étape 2 : Lancer et déboguer des tâches de formation à l'aide du SDK SageMaker Python
Pour configurer un SageMaker estimateur avec SageMaker Debugger, utilisez le SDK Amazon SageMaker Pythondebugger_hook_config
, tensorboard_output_config
et rules
.
Important
Avant de créer et d'exécuter la méthode d'ajustement de l'estimateur pour lancer une tâche d'entraînement, assurez-vous d'adapter votre script d'entraînement en suivant les instructions fournies dans Étape 1 : adapter votre script d'entraînement pour enregistrer un hook.
Construire un SageMaker estimateur avec des paramètres spécifiques au débogueur
Les exemples de code présentés dans cette section montrent comment construire un SageMaker estimateur avec les paramètres spécifiques au débogueur.
Note
Les exemples de code suivants sont des modèles pour construire les estimateurs du SageMaker cadre et ne sont pas directement exécutables. Vous devez passer aux sections suivantes et configurer les paramètres spécifiques à Debugger.
Configurez les paramètres suivants pour activer le SageMaker débogueur :
-
debugger_hook_config
(un objet deDebuggerHookConfig
) — Nécessaire pour activer le hook dans le script d'entraînement adapté pendantÉtape 1 : adapter votre script d'entraînement pour enregistrer un hook, configurer le lanceur d' SageMaker entraînement (estimateur) pour collecter les tenseurs de sortie de votre tâche d'entraînement et enregistrer les tenseurs dans votre compartiment S3 sécurisé ou votre machine locale. Pour savoir comment configurer le paramètre debugger_hook_config
, consultez Configurer le SageMaker débogueur pour enregistrer les tenseurs. -
rules
(une liste d'Rule
objets) — Configurez ce paramètre pour activer les règles intégrées du SageMaker Debugger que vous souhaitez exécuter en temps réel. Les règles intégrées sont des logiques qui déboguent automatiquement la progression de l'entraînement de votre modèle et détectent les problèmes d'entraînement en analysant les tenseurs de sortie enregistrés dans votre compartiment S3 sécurisé. Pour savoir comment configurer le paramètre rules
, consultez Configuration des règles intégrées de Debugger. Pour obtenir la liste complète des règles intégrées de débogage des tenseurs de sortie, consultez Règle Debugger. Si vous souhaitez créer votre propre logique pour détecter les problèmes d'entraînement, consultez Créer des règles personnalisées Debugger pour l'analyse des tâches d'entraînement.Note
Les règles intégrées ne sont disponibles que par le biais des instances de SageMaker formation. Vous ne pouvez pas les utiliser en mode local.
-
tensorboard_output_config
(un objet deTensorBoardOutputConfig
) — Configurez SageMaker Debugger pour collecter les tenseurs de sortie au format TensorBoard compatible et les enregistrer dans le chemin de sortie S3 spécifié dans l'objet. TensorBoardOutputConfig
Pour en savoir plus, veuillez consulter la section Visualisez les tenseurs SageMaker de sortie d'Amazon Debugger dans TensorBoard.Note
L'objet
tensorboard_output_config
doit être configuré avec le paramètredebugger_hook_config
, ce qui vous oblige également à adapter votre script d'entraînement en ajoutant le hooksagemaker-debugger
.
Note
SageMaker Debugger enregistre en toute sécurité les tenseurs de sortie dans les sous-dossiers de votre compartiment S3. Par exemple, le format de l'URI du compartiment S3 par défaut dans votre compte est s3://sagemaker-<region>-<12digit_account_id>/<base-job-name>/<debugger-subfolders>/
. Deux sous-dossiers ont été créés par SageMaker Debugger : debug-output
et. rule-output
Si vous ajoutez le paramètre tensorboard_output_config
, vous trouverez également le dossier tensorboard-output
.
Consultez les rubriques suivantes pour obtenir des exemples supplémentaires sur la façon de configurer les paramètres spécifiques à Debugger.