Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utiliser un déploiement pour une inférence à la demande
Après avoir déployé votre modèle personnalisé pour l'inférence à la demande, vous pouvez l'utiliser pour générer des réponses en effectuant des demandes d'inférence. Pour InvokeModel
nos Converse
opérations, vous utilisez le nom de ressource Amazon (ARN) du déploiement commemodelId
.
Pour plus d'informations sur les demandes d'inférence, consultez les rubriques suivantes :