Amazon CloudWatch Metrics pour le suivi et l'analyse des offres de formation

Une tâche de SageMaker formation Amazon est un processus itératif qui apprend à un modèle à faire des prédictions en présentant des exemples issus d'un ensemble de données de formation. En règle générale, un algorithme d'entraînement calcule plusieurs métriques, telles que les erreurs d'entraînement et la précision des prédictions. Ces métriques permettent de diagnostiquer si le modèle apprend bien et généralisera pour effectuer des prédictions sur des données inconnues. L'algorithme d'entraînement écrit les valeurs de ces métriques dans des journaux, que l' SageMaker IA surveille et envoie à Amazon CloudWatch en temps réel. Pour analyser les performances de votre tâche d'entraînement, vous pouvez afficher des graphiques de ces métriques dans CloudWatch. Lorsqu'une tâche de formation est terminée, vous pouvez également obtenir une liste des valeurs de métriques qu'elle calcule dans son itération finale en appelant l'opération DescribeTrainingJob.

Note

Amazon CloudWatch prend en charge les métriques personnalisées en haute résolution, et la résolution maximale est d'une seconde. Cependant, plus la résolution est fine, plus la durée de vie des CloudWatch métriques est courte. Pour la résolution de fréquence d'une seconde, les CloudWatch métriques sont disponibles pendant 3 heures. Pour plus d'informations sur la résolution et la durée de vie des CloudWatch métriques, consultez GetMetricStatisticsle Amazon CloudWatch API Reference.

Astuce

Si vous souhaitez établir le profil de votre poste de formation avec une résolution plus fine, jusqu'à une granularité de 100 millisecondes (0,1 seconde) et stocker les indicateurs de formation indéfiniment dans Amazon S3 pour une analyse personnalisée à tout moment, pensez à utiliser Amazon Debugger. SageMaker SageMaker Le débogueur fournit des règles intégrées pour détecter automatiquement les problèmes d'entraînement courants ; il détecte les problèmes d'utilisation des ressources matérielles (tels que les goulots d'étranglement du processeur, du processeur graphique et des E/S) et les problèmes de modèle non convergents (tels que le surajustement, la disparition des dégradés et l'explosion des tenseurs). SageMaker Debugger fournit également des visualisations via Studio Classic et son rapport de profilage. Pour explorer les visualisations du Debugger, consultez les rubriques Procédure pas à pas du tableau de bord SageMaker Debugger Insights, Procédure pas à pas du rapport de profilage du Debugger et Analyser les données à l'aide de la bibliothèque cliente. SMDebug

Rubriques

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Utilisez des piscines d'eau chaude gérées par l' SageMaker IA

Définition de métriques de formation