Entraînez un modèle avec Amazon SageMaker - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Entraînez un modèle avec Amazon SageMaker

Le schéma suivant montre comment vous entraînez et déployez un modèle avec Amazon SageMaker. Votre code d'entraînement accède à vos données d'entraînement et génère des artefacts de modèle à partir d'un compartiment S3. Vous pouvez ensuite envoyer des demandes à un point de terminaison du modèle pour exécuter l'inférence. Vous pouvez stocker à la fois les images de conteneur d'entraînement et d'inférence dans Amazon Elastic Container Registry (ECR).


            Votre code interagit avec un compartiment S3, un point de terminaison et un ECR pendant l'entraînement et le déploiement du modèle.

Le guide suivant met en évidence deux éléments SageMaker : la formation des modèles et le déploiement des modèles.

Pour former un mannequin SageMaker, vous devez créer un poste de formation. La tâche d'entraînement comprend les informations suivantes :

  • L'URL du compartiment Amazon Simple Storage Service (Amazon S3) dans lequel vous avez stocké les données d'entraînement.

  • Les ressources de calcul que vous souhaitez utiliser SageMaker pour l'entraînement des modèles. Les ressources de calcul sont des instances de calcul d'apprentissage automatique (ML) gérées par SageMaker.

  • L'URL du compartiment S3 où vous souhaitez stocker la sortie de la tâche.

  • Le chemin d'accès Amazon Elastic Container Registry dans lequel le code d'entraînement est stocké. Pour plus d'informations, consultez Chemins de registre Docker et exemple de code.

Note

Votre jeu de données d'entrée doit être dans la même Région AWS que votre tâche d'entraînement.

Pour l'algorithme d'entraînement, vous disposez des options suivantes :

Une fois que vous avez créé la tâche de formation, SageMaker lancez les instances de calcul ML et utilisez le code d'apprentissage et le jeu de données d'entraînement pour entraîner le modèle. Il enregistre les artefacts de modèle résultants et d'autres sorties dans le compartiment S3 que vous avez spécifié à cet effet.

Vous pouvez créer une tâche de formation à l'aide de la SageMaker console ou de l'API. Pour plus d'informations sur la création d'une tâche d'entraînement avec l'API, consultez l'API CreateTrainingJob.

Lorsque vous créez une tâche de formation avec l'API, l'ensemble de données est SageMaker répliqué par défaut sur les instances de calcul ML. Pour SageMaker dupliquer un sous-ensemble des données de chaque instance de calcul ML, vous devez définir le S3DataDistributionType champ sur. ShardedByS3Key Vous pouvez définir ce champ à l'aide du kit SDK de bas niveau. Pour plus d'informations, consultez S3DataDistributionType dans S3DataSource.

Important

Pour éviter que votre conteneur d'algorithmes ne se dispute de la mémoire, nous réservons de la mémoire pour nos processus système SageMaker critiques sur vos instances de calcul ML. Vous ne pouvez donc pas vous attendre à voir toute la mémoire correspondant à votre type d'instance.