Formation distribuée avec la bibliothèque de parallélisme de données distribué basée sur l' SageMaker IA

La bibliothèque de parallélisme distribué des données (SMDDP) basée sur l' SageMaker IA est conçue pour être facile à utiliser et pour permettre une intégration parfaite avec. PyTorch

Lorsque vous entraînez un modèle d'apprentissage profond à l'aide de la bibliothèque SMDDP sur l' SageMaker IA, vous pouvez vous concentrer sur la rédaction de votre script de formation et sur l'entraînement du modèle.

Pour commencer, importez la bibliothèque SMDDP afin d'utiliser ses opérations collectives optimisées pour. AWS Les rubriques suivantes fournissent des instructions sur les éléments à ajouter à votre script d'entraînement en fonction de l'opération collective que vous souhaitez optimiser.

Rubriques

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Frameworks et types Régions AWS d'instances pris en charge

Adaptation de votre script d'entraînement pour utiliser les opérations collectives du SMDDP