Invocación del punto de conexión - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Invocación del punto de conexión

Una vez que el punto final esté en ejecución, utilice la InvokeEndpointAPI SageMaker de tiempo de ejecución del servicio SageMaker de tiempo de ejecución para enviar solicitudes al punto final o invocarlo. En respuesta, el explicador de Clarify gestiona las solicitudes como solicitudes de explicabilidad. SageMaker

nota

Para invocar un punto de conexión, elija una de las siguientes opciones:

Solicitud

La API InvokeEndpoint tiene un parámetro opcional EnableExplanations, que se asigna al encabezado HTTP X-Amzn-SageMaker-Enable-Explanations. Si se proporciona este parámetro, anula el parámetro EnableExplanationsde ClarifyExplainerConfig.

nota

Los parámetros ContentType y Accept de la API InvokeEndpoint son obligatorios. Los formatos admitidos incluyen el tipo MIME text/csv y application/jsonlines.

Utilice sagemaker_runtime_client para enviar una solicitud al punto de conexión de la siguiente manera:

response = sagemaker_runtime_client.invoke_endpoint( EndpointName='name-of-your-endpoint', EnableExplanations='`true`', ContentType='text/csv', Accept='text/csv', Body='1,2,3,4', # single record (of four numerical features) )

En el caso de los puntos finales multimodelo, transfiere un TargetModel parámetro adicional en la solicitud de ejemplo anterior para especificar el modelo al que dirigirse en el punto final. El punto de conexión multimodelo carga dinámicamente los modelos de destino según sea necesario. Para obtener más información sobre los puntos finales multimodelo, consulte. Alojar varios modelos en un contenedor detrás de un punto de conexión Consulte el cuaderno de muestra SageMaker Clarify Online sobre la explicabilidad de los terminales multimodelo para ver un ejemplo de cómo configurar e invocar varios modelos de destino desde un único punto final.

Respuesta

Si el punto de conexión se crea con ExplainerConfig, entonces, se utiliza un nuevo esquema de respuesta. Este nuevo esquema es diferente y no es compatible con un punto de conexión que carezca del parámetro ExplainerConfig proporcionado.

El tipo MIME de la respuesta es application/json, y la carga de la respuesta se puede decodificar de bytes UTF-8 a un objeto JSON. A continuación se muestra que los miembros de este objeto JSON son los siguientes:

  • version: la versión del esquema de respuesta en formato de cadena. Por ejemplo, 1.0.

  • predictions: las predicciones que hace la solicitud son las siguientes:

    • content_type: el tipo MIME de las predicciones, en referencia al ContentType de la respuesta del contenedor de modelos.

    • data: la cadena de datos de las predicciones entregada como carga de la respuesta del contenedor de modelos a la solicitud.

  • label_headers: los encabezados de las etiquetas del parámetro LabelHeaders. Esto se proporciona en la configuración del explicador o en la salida del contenedor de modelos.

  • explanations: las explicaciones que figuran en la carga de la solicitud. Si no se explica ningún registro, este miembro devuelve el objeto {} vacío.

    • kernel_shap: una clave que hace referencia a una matriz de explicaciones SHAP del kernel para cada registro de la solicitud. Si un registro no tiene explicación, la explicación correspondiente es null.

El elemento kernel_shap tiene los siguientes miembros:

  • feature_header: el nombre del encabezado de las características que proporciona el parámetro FeatureHeaders en la configuración del explicador ExplainerConfig.

  • feature_type: el tipo de característica inferido por el explicador o proporcionado en el parámetro FeatureTypes en ExplainerConfig. Este elemento solo está disponible para problemas de explicabilidad de NLP.

  • attributions: una matriz de objetos de atribución. Las características de texto pueden tener varios objetos de atribución, cada uno para una unidad. El objeto de atribución tiene los siguientes miembros:

    • attribution: una lista de valores de probabilidad, proporcionada para cada clase.

    • description: la descripción de las unidades de texto, disponible solo para problemas de explicabilidad de NLP.

      • partial_text: la parte del texto explicada por el explicador.

      • start_idx: un índice de base cero para identificar la ubicación de la matriz al principio del fragmento de texto parcial.