Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Invocación de un punto de conexión sin servidor

Modo de enfoque
Invocación de un punto de conexión sin servidor - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Para realizar la inferencia utilizando un punto de conexión sin servidor, debe enviar una solicitud HTTP al punto de conexión. Puede usar la InvokeEndpointAPI o la AWS CLI, que realizan una POST solicitud para invocar su punto final. El tamaño máximo de carga útil de solicitud y respuesta para las invocaciones sin servidor es de 4 MB. Para puntos de conexión sin servidor:

  • El modelo debería descargarse y el servidor debería responder correctamente a /ping en un plazo de 3 minutos.

  • El tiempo de espera para que el contenedor responda a las solicitudes de inferencia de /invocations es de 1 minuto.

Invocar un punto de conexión

El siguiente ejemplo usa el AWS SDK para Python (Boto3) para llamar a la API. InvokeEndpoint Ten en cuenta que, a diferencia de las demás llamadas a la API de esta guíaInvokeEndpoint, for debes usar SageMaker Runtime Runtime como cliente. Especifique los siguientes valores:

  • En endpoint_name, utilice el nombre del punto de conexión sin servidor en servicio que quiera invocar.

  • En content_type, especifique el tipo MIME de sus datos de entrada en el cuerpo de la solicitud (por ejemplo, application/json).

  • En payload, utilice la carga útil de la solicitud como inferencia. Su carga útil debe estar en bytes o un objeto similar a un archivo.

runtime = boto3.client("sagemaker-runtime") endpoint_name = "<your-endpoint-name>" content_type = "<request-mime-type>" payload = <your-request-body> response = runtime.invoke_endpoint( EndpointName=endpoint_name, ContentType=content_type, Body=payload )
PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.