Configurer l'utilisation des ressources matérielles du système de surveillance de Debugger
Afin d'ajuster les intervalles de temps de surveillance du système de Debugger, utilisez l'opération d'API ProfilerConfig
pour créer un objet de paramètre lors de la création d'un cadre SageMaker ou d'un estimateur générique en fonction de vos préférences.
Par défaut, pour toutes les tâches d'entraînement SageMaker, Debugger collecte les données d'utilisation du système matériel à partir des instances Amazon EC2 toutes les 500 millisecondes pour la surveillance du système, sans aucun paramètre spécifique à Debugger spécifié dans les estimateurs SageMaker.
Debugger enregistre les métriques système dans un compartiment S3 par défaut. Le format de l'URI du compartiment S3 par défaut est s3://sagemaker-<region>-<12digit_account_id>/<training-job-name>/profiler-output/
.
L'exemple de code suivant illustre la configuration du paramètre profiler_config
avec un intervalle de temps de surveillance système de 1 000 millisecondes.
from sagemaker.debugger import ProfilerConfig profiler_config=ProfilerConfig( system_monitor_interval_millis=
1000
)
-
system_monitor_interval_millis
(int) : spécifiez les intervalles de surveillance en millisecondes pour enregistrer les métriques système. Les valeurs disponibles sont 100, 200, 500, 1 000 (1 seconde), 5 000 (5 secondes) et 60 000 (1 minute) millisecondes. La valeur par défaut est de 500 millisecondes.
Pour voir la progression de la surveillance système, consultez Ouvrir le tableau de bord Amazon SageMaker Debugger Insights.