Déploiement de modèle Amazon SageMaker Autopilot - Amazon SageMaker

Déploiement de modèle Amazon SageMaker Autopilot

Plusieurs options s'offrent à vous pour déployer le modèle qui a produit la meilleure métrique de validation dans une expérience Autopilot. Si vous utilisez Autopilot dans SageMaker Studio, vous pouvez déployer le modèle automatiquement ou manuellement. Si vous travaillez dans un autre développement, vous pouvez appeler directement les API d'Autopilot pour déployer un modèle.

  • Automatiquement : pour déployer automatiquement le meilleur modèle, d'une expérience Autopilot vers un point de terminaison, acceptez la valeur par défaut Auto Deploy à Active lors de la création de l'expérience dans SageMaker Studio.

    
            Sélectionnez Decide to use automatic deployment (Décider d'utiliser le déploiement automatique).
    Note

    Le déploiement automatique échoue si le quota de ressources par défaut ou votre quota client pour les instances de point de terminaison dans une région est trop limité. Actuellement, vous devez avoir au moins deux instances ml.m5.2xlarge. La région eu-nord-1 (Stockholm) ne répond pas à cette exigence, par exemple. Les types d'instance pris en charge pour cette région sont répertoriés dans SageMaker Instance Types in EU (Stockholm) eu-north-1 (Types d'instance SageMaker dans UE (Stockholm) eu-nord-1). Si vous rencontrez ce problème, vous pouvez demander à augmenter la limite de service des instances de points de terminaison SageMaker en suivant la procédure dans Régions et quotas pris en charge. Dans le panneau Case details (Détails du cas), sélectionnez SageMaker Endpoints (Points de terminaison SageMaker) comme Limit type (Type de limite). Pour Request1 (Demande1), sélectionnez :

    • Region (Région) :UE (Stockholm)

    • Resource Type (Type de ressource) :SageMaker Hosting (Hébergement SageMaker)

    • Limit (Limite) :ml.m5.2xlarge (au moins)

    • New limit value (Nouvelle valeur limite) : 2

  • Manuellement : pour déployer manuellement le meilleur modèle, d'une expérience Autopilot vers un point de terminaison, définissez la valeur Auto Deploy à Inactive lors de la création de l'expérience dans SageMaker Studio.

    
            Sélectionnez Decide to use automatic deployment (Décider d'utiliser le déploiement automatique).
  • API calls (Appels d'API) : effectuez la série suivante d'appels d'API :

Le déploiement automatique des résultats d'une expérience dans SageMaker Studio appelle par défaut les six API répertoriées dans cette dernière option. pour de plus amples informations sur la création d'une expérience, veuillez consulter Créer une expérience Amazon SageMaker Autopilot.

Note

Pour éviter des frais inutiles, supprimez les points de terminaison et les ressources créés lors du déploiement du modèle et qui ne sont plus nécessaires. Pour obtenir des informations sur la tarification des instances par région, veuillez consulter Amazon SageMaker Pricing (Tarification Amazon SageMaker).