Utilisation d'un package de modèle pour créer un modèle - Amazon SageMaker

Utilisation d'un package de modèle pour créer un modèle

Utilisez un package de modèle afin de créer un modèle pouvant être déployé que vous utiliserez pour obtenir les inférences en temps réel en configurant un point de terminaison hébergé ou d'exécuter des tâches de transformation par lots. Vous pouvez créer un modèle déployable à partir d'un package de modèle à l'aide de la console Amazon SageMaker, de l'API Amazon SageMaker de bas niveau ou du kit SDK Python Amazon SageMaker.

Utilisation d'un package de modèle pour créer un modèle (console)

Pour créer un modèle pouvant être déployé à partir d'un package de modèle (console)

  1. Ouvrez la console SageMaker à l'adresse https://console.aws.amazon.com/sagemaker/.

  2. Choisissez Model packages (Packages de modèle).

  3. Choisissez un package de modèle que vous avez créé dans la liste de l'onglet My model packages (Mes packages de modèle) ou choisissez un package de modèle auquel vous vous êtes abonné sur l'onglet des abonnements AWS Marketplace.

  4. Sélectionnez Create model.

  5. Sous Nom du modèle, attribuez un nom au modèle.

  6. Sous IAM role (Rôle IAM), choisissez un rôle IAM qui détient les autorisations requises pour appeler d'autres services en votre nom ou choisissez Create a new role (Créer un rôle) pour que SageMaker crée un rôle avec la politique gérée AmazonSageMakerFullAccess attachée. Pour plus d'informations, consultez Rôles SageMaker.

  7. Sous VPC, choisissez un Amazon VPC auquel le modèle pourra accéder. Pour de plus amples informations, veuillez consulter Attribuer aux point de terminaison hébergés SageMaker l'accès aux ressources de votre Amazon VPC.

  8. Conservez les valeurs par défaut des options Container input options (Options d'entrée du conteneur) et Choose model package (Choisir le package de modèle).

  9. Indiquez ensuite les noms et les valeurs des variables d'environnement que vous souhaitez transmettre au conteneur de modèle.

  10. Sous Balises, spécifiez une ou plusieurs balises permettant de gérer le modèle. Chaque balise est constituée d'une clé et d'une valeur facultative. Les clés de balise doivent être uniques à chaque ressource.

  11. Sélectionnez Create model.

Une fois le modèle déployable créé, vous pouvez l'utiliser afin de configurer un point de terminaison pour l'inférence en temps réel ou de créer une tâche de transformation par lots afin d'obtenir les inférences sur tous les ensembles de données. Pour obtenir des informations sur l'hébergement de points de terminaison dans SageMaker, veuillez consulter Deploy Models for Inference (Déployer des modèles pour l'inférence).

Utilisation d'un package de modèle pour créer un modèle (API)

Pour utiliser un package de modèle afin de créer un modèle déployable à l'aide de l'API SageMaker, spécifiez le nom ou l'Amazon Resource Name (ARN) du package de modèle dans le champ ModelPackageName de l'objet ContainerDefinition que vous transmettez à l'API CreateModel.

Une fois le modèle déployable créé, vous pouvez l'utiliser afin de configurer un point de terminaison pour l'inférence en temps réel ou de créer une tâche de transformation par lots afin d'obtenir les inférences sur tous les ensembles de données. Pour obtenir des informations sur les points de terminaison hébergés dans SageMaker, veuillez consulter Deploy Models for Inference (Déployer des modèles pour l'inférence).

Utiliser un package de modèle pour créer un modèle (kit SDK Python Amazon SageMaker)

Pour utiliser un package de modèle afin de créer un modèle déployable à l'aide du kit SDK Python SageMaker, initialisez un objet ModelPackage et transmettez l'Amazon Resource Name (ARN) du package de modèle en tant qu'argument model_package_arn. Exemples :

from sagemaker import ModelPackage model = ModelPackage(role='SageMakerRole', model_package_arn='training-job-scikit-decision-trees-1542660466-6f92', sagemaker_session=sagemaker_session)

Une fois le modèle déployable créé, vous pouvez l'utiliser afin de configurer un point de terminaison pour l'inférence en temps réel ou de créer une tâche de transformation par lots afin d'obtenir les inférences sur tous les ensembles de données. Pour obtenir des informations sur l'hébergement de points de terminaison dans SageMaker, veuillez consulter Deploy Models for Inference (Déployer des modèles pour l'inférence).