Cadres et algorithmes pris en charge - Amazon SageMaker

Cadres et algorithmes pris en charge

Le tableau suivant présente les cadres et les algorithmes de machine learning SageMaker pris en charge par Debugger.

SageMaker-supported frameworks and algorithms Monitoring system bottlenecks Profiling deep learning framework operations Debugging output tensors

TensorFlow

Tous les conteneurs AWS Deep Learning Containers

AWS TensorFlow Deep Learning Containers version 2.3.1 ou ultérieure

AWS TensorFlow Deep Learning Containers version 1.15.4 ou ultérieure

PyTorch

AWS PyTorch Deep Learning Containers version 1.6.0 ou ultérieure

AWS PyTorch Deep Learning Containers version 1.5.0 ou ultérieure

MXNet

-

AWS MXNet Deep Learning Containers version 1.6.0 ou ultérieure

XGBoost

1.0-1, 1.2-1, 1.3-1

-

1.0-1, 1.2-1, 1.3-1

Estimateur générique SageMaker

Algorithmes intégrés SageMaker utilisant des URI d'image

Conteneurs d'entraînement personnalisés (avec des images de conteneurs AWS Deep Learning Containers, des images Docker publiques ou vos propres images Docker)

-

Conteneurs d'entraînement personnalisés (disponibles pour TensorFlow, PyTorch, MXNet et XGBoost avec enregistrement manuel de hook)

  • Goulets d'étranglement du système de surveillance : contrôlez le taux d'utilisation du système pour les ressources telles que les métriques d'I/O du CPU, du GPU, des mémoires, du réseau et des données. Il s'agit d'une fonction agnostique de cadre et de modèle disponible pour toutes les tâches d'entraînement dans SageMaker.

  • Profilage des opérations de deep learning : profilez les opérations de deep learning des cadres TensorFlow et PyTorch, telles que les durées des étapes, les chargeurs de données, les opérations en avant et en arrière, les métriques de profilage Python et les métriques spécifiques au cadre.

  • Débogage des tenseurs de sortie : suivez et déboguez les paramètres du modèle, tels que les pondérations, les gradients, les biais et les valeurs scalaires de votre tâche d'entraînement. Les cadres de deep learning disponibles sont Apache MXNet, TensorFlow, PyTorch et GXBoost.

    Important

    Pour le framework TensorFlow avec Keras, SageMaker Debugger rend obsolète la prise en charge du changement de code zéro pour les modèles de débogage créés à l'aide des modules tf.keras de TensorFlow 2.6 et version ultérieure. Cela est dû aux évolutions annoncées dans les notes de mise à jour de TensorFlow 2.6.0. SageMaker Debugger continue de prendre en charge l'expérience de changement de code zéro pour le TensorFlow natif (qui exclut les modules tf.keras).

Si le cadre ou l'algorithme que vous souhaitez entraîner et déboguer n'est pas répertorié dans le tableau, accédez au forum de discussion AWS et laissez vos commentaires sur SageMaker Debugger.

Utiliser Debugger avec des conteneurs d'entraînement personnalisés

Apportez vos conteneurs d'entraînement dans SageMaker et obtenez des informations sur vos tâches d'entraînement à l'aide de Debugger. Améliorez votre efficacité en optimisant votre modèle sur les instances Amazon EC2 à l'aide des fonctions de surveillance et de débogage.

Pour savoir comment créer votre conteneur d'entraînement avec la bibliothèque client SMDebug, le transmettre à Amazon Elastic Container Registry (Amazon ECR) et le contrôler et le déboguer, consultez Utiliser Debugger avec des conteneurs d'entraînement personnalisés.

Référentiels GitHub open-source sur Debugger

Les API Debugger sont fournies via le kit SDK Python SageMaker et sont conçues pour créer des configurations de hook et de règles Debugger pour les opérations d'API CreateTrainingJob et DescribeTrainingJob de Sagemaker. La bibliothèque client SMDebug fournit des outils pour enregistrer des hooks et accéder aux données d'entraînement via sa fonction d'essai, le tout grâce à ses opérations d'API flexibles et puissantes. Il prend en charge les cadres de machine learning TensorFlow, PyTorch, MXNet et XGBoost sur Python 3.6 et versions ultérieures.

Pour obtenir des ressources directes sur Debugger et les opérations d'API SMDebug, consultez les liens suivants :

Si vous utilisez le kit SDK pour Java pour effectuer des tâches d'entraînement SageMaker et que vous souhaitez configurer les API Debugger, consultez les références suivantes :