Cómo crear un punto de conexión de inferencia asíncrono

Cree un punto final asíncrono de la misma manera que crearía un punto final con los servicios de alojamiento de IA: SageMaker

Cree un modelo en SageMaker IA con. CreateModel
Crear una configuración del punto de conexión con CreateEndpointConfig.
Crear un punto de conexión HTTPS con CreateEndpoint.

Para crear un punto de conexión, primero debe crear un modelo con CreateModel; debe apuntar al artefacto del modelo y a una ruta de registro de Docker (imagen). A continuación, cree una configuración en la CreateEndpointConfigque especifique uno o más modelos que se crearon con la CreateModel API para su implementación y los recursos que desea que la SageMaker IA aprovisione. Cree un punto de conexión con CreateEndpoint utilizando la configuración de punto de conexión especificada en la solicitud. Puede actualizar un punto de conexión asíncrono con la API UpdateEndpoint. Envíe y reciba solicitudes de inferencia desde el modelo alojado en el punto de conexión con InvokeEndpointAsync. Puede eliminar sus puntos de conexión con la API DeleteEndpoint.

Para obtener una lista completa de las SageMaker imágenes disponibles, consulte Imágenes disponibles de Deep Learning Containers. Consulte Contenedores con código de inferencia personalizado para obtener información sobre cómo crear una imagen de Docker.

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Cumplimiento de los requisitos previos de

Creación de un modelo