Configurar la inferencia para un modelo personalizado

Tras crear un modelo personalizado, puede configurar la inferencia mediante una de las siguientes opciones:

Adquiera el rendimiento aprovisionado: compre el rendimiento aprovisionado para su modelo a fin de configurar una capacidad de cómputo dedicada con un rendimiento garantizado a fin de lograr un rendimiento uniforme y una latencia más baja.

Para obtener más información sobre el rendimiento aprovisionado, consulte Aumento de la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock. Para obtener más información sobre el uso de modelos personalizados con el rendimiento aprovisionado, consulte. Adquisición de rendimiento aprovisionado para un modelo personalizado
Implemente un modelo personalizado para la inferencia bajo demanda (solo Amazon Nova modelos): para configurar la inferencia bajo demanda, implemente el modelo con un despliegue de modelo personalizado. Después de implementar el modelo, lo invoca mediante el ARN para la implementación del modelo personalizado. Con la inferencia bajo demanda, solo paga por lo que usa y no necesita configurar los recursos informáticos aprovisionados.

Para obtener más información sobre la implementación de modelos personalizados para la inferencia bajo demanda, consulte. Implementar un modelo personalizado para inferencia bajo demanda

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Visualización de los detalles de un modelo personalizado

Adquisición de rendimiento aprovisionado para un modelo personalizado