Comment exécuter une tâche de formation distribuée avec la bibliothèque de parallélisme de données SageMaker distribuée - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Comment exécuter une tâche de formation distribuée avec la bibliothèque de parallélisme de données SageMaker distribuée

La bibliothèque de parallélisme des données SageMaker distribuées (SMDDP) est conçue pour être facile à utiliser et pour permettre une intégration parfaite avec. PyTorch

Lorsque vous entraînez un modèle de deep learning avec la bibliothèque SMDDP activée SageMaker, vous pouvez vous concentrer sur l'écriture de votre script de formation et sur l'entraînement du modèle.

Pour commencer, importez la bibliothèque SMDDP afin d'utiliser ses opérations collectives optimisées pour. AWS Les rubriques suivantes fournissent des instructions sur les éléments à ajouter à votre script d'entraînement en fonction de l'opération collective que vous souhaitez optimiser.