Configurer l'utilisation des ressources matérielles du système de surveillance de Debugger - Amazon SageMaker

Configurer l'utilisation des ressources matérielles du système de surveillance de Debugger

Afin d'ajuster les intervalles de temps de surveillance du système de Debugger, utilisez l'opération d'API ProfilerConfig pour créer un objet de paramètre lors de la création d'un cadre SageMaker ou d'un estimateur générique en fonction de vos préférences.

Note

Par défaut, pour toutes les tâches d'entraînement SageMaker, Debugger collecte les données d'utilisation du système matériel à partir des instances Amazon EC2 toutes les 500 millisecondes pour la surveillance du système, sans aucun paramètre spécifique à Debugger spécifié dans les estimateurs SageMaker.

Debugger enregistre les métriques système dans un compartiment S3 par défaut. Le format de l'URI du compartiment S3 par défaut est s3://sagemaker-<region>-<12digit_account_id>/<training-job-name>/profiler-output/.

L'exemple de code suivant illustre la configuration du paramètre profiler_config avec un intervalle de temps de surveillance système de 1 000 millisecondes.

from sagemaker.debugger import ProfilerConfig profiler_config=ProfilerConfig( system_monitor_interval_millis=1000 )
  • system_monitor_interval_millis (int) : spécifiez les intervalles de surveillance en millisecondes pour enregistrer les métriques système. Les valeurs disponibles sont 100, 200, 500, 1 000 (1 seconde), 5 000 (5 secondes) et 60 000 (1 minute) millisecondes. La valeur par défaut est de 500 millisecondes.

Pour voir la progression de la surveillance système, consultez Ouvrir le tableau de bord Amazon SageMaker Debugger Insights.