Obtention d'instances potentielles instantanées

Inference Recommender peut également vous fournir une liste d'instances potentielles, ou de types d'instances susceptibles de convenir à votre modèle, sur la page de détails de votre modèle d' SageMaker IA. Inference Recommender effectue automatiquement une analyse comparative préliminaire par rapport à votre modèle afin que vous puissiez fournir les cinq principales instances potentielles. Comme il s'agit de recommandations préliminaires, nous vous recommandons d'exécuter d'autres tâches de recommandation d'instance pour obtenir des résultats plus précis.

Vous pouvez afficher la liste des instances potentielles de votre modèle par programmation à l'aide de l'DescribeModelAPI, du SDK SageMaker Python ou de la SageMaker console AI.

Note

Vous n'obtiendrez pas d'instances potentielles pour les modèles que vous avez créés dans SageMaker AI avant que cette fonctionnalité ne soit disponible.

Pour afficher les instances potentielles de votre modèle via la console, procédez comme suit :

Accédez à la SageMaker console à l'adresse https://console.aws.amazon.com/sagemaker/.
Dans le panneau de navigation de gauche, choisissez Inférence, puis Modèles.
Dans la liste des modèles, choisissez votre modèle.

Sur la page de détails de votre modèle, accédez à la section Instances potentielles pour déployer le modèle. La capture d'écran suivante montre cette section.

Capture d'écran de la liste des instances potentielles sur la page de détails du modèle.

Dans cette section, vous pouvez afficher les instances potentielles optimisées en termes de coût, de débit et de latence pour le déploiement du modèle, ainsi que des informations supplémentaires pour chaque type d'instance, telles que la taille de la mémoire, le nombre de CPU et de GPU et le coût par heure.

Si vous décidez d'analyser un échantillon de charge utile et d'exécuter une tâche de recommandation d'inférence complète pour votre modèle, vous pouvez démarrer une tâche de recommandation d'inférence par défaut à partir de cette page. Pour démarrer une tâche par défaut via la console, procédez comme suit :

Sur la page de détails de votre modèle, dans la section Instances potentielles pour déployer le modèle, choisissez Exécuter la tâche Inference Recommender.
Dans la boîte de dialogue qui apparaît, pour le compartiment S3 destiné à l'analyse comparative de la charge utile, entrez l'emplacement Amazon S3 où vous avez stocké un échantillon de charge utile pour votre modèle.
Pour Type de contenu de la charge utile, entrez les types MIME pour vos données de charge utile.
(Facultatif) Dans la section Compilation du modèle à l'aide de SageMaker Neo, pour la configuration de saisie des données, entrez une forme de données au format dictionnaire.
Choisissez Exécuter la tâche.

Inference Recommender démarre la tâche, et vous pouvez consulter la tâche et ses résultats sur la page de liste des recommandations d'inférence de la console AI. SageMaker

Si vous souhaitez exécuter une tâche avancée et effectuer des tests de charge personnalisés, ou si vous souhaitez configurer des réglages et des paramètres supplémentaires pour votre tâche, consultez Exécuter un test de charge personnalisé.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Tâches de recommandations

Recommandations d'inférence