Emplois de recommandation avec Amazon SageMaker Inference Recommender

Amazon SageMaker Inference Recommender peut émettre deux types de recommandations :

Les recommandations d'instances (type de tâche Default) exécutent un ensemble de tests de charge sur les types d'instances recommandés. Vous pouvez également effectuer un test de charge pour un point de terminaison sans serveur. Il vous suffit de fournir un package de modèle Amazon Resource Name (ARN) pour lancer ce type de tâche de recommandation. Les tâches de recommandation d'inférence sont terminées en 45 minutes.
Les recommandations de point de terminaison (type de tâche Advanced) sont basées sur un test de charge personnalisé dans lequel vous sélectionnez les instances de machine learning que vous voulez ou un point de terminaison sans serveur, fournissez un modèle de trafic personnalisé et des exigences de latence et de débit en fonction de vos exigences de production. Cette tâche dure en moyenne 2 heures en fonction de la durée de la tâche définie et du nombre total de configurations d'inférences testées.

Les deux types de recommandations utilisent la même APIs méthode pour créer, décrire et arrêter des tâches. La sortie est une liste de recommandations de configuration d'instance avec les variables d'environnement associées, les métriques de coût, de débit et de latence. Les tâches de recommandation fournissent également un nombre initial d'instances, que vous pouvez utiliser pour configurer une politique de dimensionnement automatique. Pour différencier les deux types de tâches, lorsque vous créez une tâche via la console SageMaker AI ou le, spécifiez de créer des recommandations préliminaires sur les points Default de terminaison APIs, des tests de charge personnalisés et Advanced des recommandations de point de terminaison.

Note

Vous n'avez pas besoin d'effectuer les deux types de tâches de recommandation dans votre propre flux de travail. Vous pouvez faire l'une indépendamment de l'autre.

Inference Recommender peut également vous fournir une liste d'instances potentielles, ou les cinq principaux types d'instances optimisés en termes de coût, de débit et de latence pour le déploiement du modèle, ainsi qu'un score de confiance. Vous pouvez choisir ces instances lors du déploiement de votre modèle. Inference Recommender effectue automatiquement une analyse comparative par rapport à votre modèle afin que vous puissiez fournir les instances potentielles. Comme il s'agit de recommandations préliminaires, nous vous recommandons d'exécuter d'autres tâches de recommandation d'instance pour obtenir des résultats plus précis. Pour consulter les instances potentielles, rendez-vous sur la page de détails de votre modèle d' SageMaker IA. Pour de plus amples informations, veuillez consulter Obtention d'instances potentielles instantanées.

Rubriques

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Prérequis

Obtention d'instances potentielles instantanées