Puntos de conexión con varios contenedores

SageMaker Los puntos de enlace multicontenedor de IA permiten a los clientes implementar varios contenedores, que utilizan diferentes modelos o marcos, en un único punto de enlace de IA. SageMaker Los contenedores se pueden ejecutar en secuencia como una canalización de inferencia, o se puede acceder a cada contenedor de forma individual mediante la invocación directa para mejorar la utilización de los puntos de conexión y optimizar los costes.

Para obtener información sobre cómo invocar los contenedores de un punto de conexión multicontenedor de forma secuencial, consulte Canalizaciones de inferencia en Amazon AI SageMaker .

Para obtener información sobre cómo invocar un contenedor específico de un punto de conexión multicontenedor, consulte Invoque un punto de conexión multicontenedor con invocación directa

Temas

La siguiente política permite solicitudes invoke_endpoint solo cuando el valor del campo TargetContainerHostname coincide con una de las expresiones regulares especificadas.

La siguiente política deniega solicitudes invoke_endpoint solo cuando el valor del campo TargetContainerHostname coincide con una de las expresiones regulares especificadas de la declaración Deny.

Para obtener información sobre las claves de condición de la SageMaker IA, consulte las claves de condición de la SageMaker IA en la Guía del usuario.AWS Identity and Access Management

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Establecer políticas de escalado automático para implementaciones de puntos de conexión multimodelo

Para crear un punto de conexión multicontenedor (Boto 3)