Déployez un modèle personnalisé pour une inférence à la demande - Amazon Nova

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Déployez un modèle personnalisé pour une inférence à la demande

Une fois que vous avez créé avec succès un modèle personnalisé à l'aide d'une tâche de personnalisation du modèle (réglage fin, distillation ou formation préalable continue), vous pouvez configurer l'inférence à la demande pour le modèle.

Pour configurer l'inférence à la demande pour un modèle personnalisé, vous déployez le modèle avec un déploiement de modèle personnalisé. Après avoir déployé votre modèle personnalisé, vous utilisez le nom de ressource Amazon (ARN) du déploiement comme modelId paramètre dans vos opérations InvokeModel ou dans celles de Converse l'API. Vous pouvez utiliser le modèle déployé pour des inférences à la demande avec les fonctionnalités d'Amazon Bedrock telles que les terrains de jeu, les agents et les bases de connaissances.

Modèles pris en charge

Vous pouvez configurer l'inférence à la demande pour les modèles suivants :

  • Toile Amazon Nova

  • Amazon Nova Lite

  • Amazon Nova Micro

  • Amazon Nova Pro