Utiliser un déploiement pour une inférence à la demande

Après avoir déployé votre modèle personnalisé pour l'inférence à la demande, vous pouvez l'utiliser pour générer des réponses en effectuant des demandes d'inférence. Pour InvokeModel nos Converse opérations, vous utilisez le nom de ressource Amazon (ARN) du déploiement commemodelId.

Pour plus d'informations sur les demandes d'inférence, consultez les rubriques suivantes :

Soumettez des invites et générez des réponses grâce à l'inférence du modèle
Conditions préalables à l'exécution de l'inférence de modèles
Soumettre des invites et générer des réponses à l'aide de l'API

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Déployer un modèle personnalisé

Supprimer un déploiement de modèle personnalisé