Déployez un modèle personnalisé pour une inférence à la demande

Une fois que vous avez créé avec succès un modèle personnalisé à l'aide d'une tâche de personnalisation du modèle (réglage fin, distillation ou formation préalable continue), vous pouvez configurer l'inférence à la demande pour le modèle.

Pour configurer l'inférence à la demande pour un modèle personnalisé, vous déployez le modèle avec un déploiement de modèle personnalisé. Après avoir déployé votre modèle personnalisé, vous utilisez le nom de ressource Amazon (ARN) du déploiement comme modelId paramètre dans vos opérations InvokeModel ou dans celles de Converse l'API. Vous pouvez utiliser le modèle déployé pour des inférences à la demande avec les fonctionnalités d'Amazon Bedrock telles que les terrains de jeu, les agents et les bases de connaissances.

Rubriques

Modèles pris en charge

Vous pouvez configurer l'inférence à la demande pour les modèles suivants :

Toile Amazon Nova
Amazon Nova Lite
Amazon Nova Micro
Amazon Nova Pro

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Utilisation de l'API Invoke

Déployer un modèle personnalisé