Invocación del punto de conexión

Una vez que el punto final esté en ejecución, usa la InvokeEndpointAPI SageMaker AI Runtime del servicio SageMaker AI Runtime para enviar solicitudes al punto final o invocarlo. En respuesta, el explicador de Clarify gestiona las solicitudes como solicitudes de explicabilidad. SageMaker

nota

Para invocar un punto de conexión, elija una de las siguientes opciones:

Para obtener instrucciones sobre cómo usar Boto3 o para invocar un punto final, AWS CLI consulte. Invocación de modelos para realizar inferencias en tiempo real
Para usar el SageMaker SDK para Python a fin de invocar un punto final, consulta la API de Predictor.

Solicitud

La API InvokeEndpoint tiene un parámetro opcional EnableExplanations, que se asigna al encabezado HTTP X-Amzn-SageMaker-Enable-Explanations. Si se proporciona este parámetro, anula el parámetro EnableExplanationsde ClarifyExplainerConfig.

nota

Los parámetros ContentType y Accept de la API InvokeEndpoint son obligatorios. Los formatos admitidos incluyen el tipo MIME text/csv y application/jsonlines.

Utilice sagemaker_runtime_client para enviar una solicitud al punto de conexión de la siguiente manera:


response = sagemaker_runtime_client.invoke_endpoint(
    EndpointName='name-of-your-endpoint',
    EnableExplanations='`true`',
    ContentType='text/csv',
    Accept='text/csv',
    Body='1,2,3,4',  # single record (of four numerical features)
)

Para los puntos de conexión multimodelo, pase un parámetro TargetModel adicional en la solicitud de ejemplo anterior para especificar a qué modelo debe dirigirse en el punto de conexión. El punto de conexión multimodelo carga dinámicamente los modelos de destino según sea necesario. Para obtener más información sobre puntos de conexión multimodelo, consulte Puntos de conexión multimodelo. Consulte el cuaderno de muestra SageMaker Clarify Online Explicability on MultiModel Endpoint para ver un ejemplo de cómo configurar e invocar varios modelos de destino desde un único punto final.

Respuesta

Si el punto de conexión se crea con ExplainerConfig, entonces, se utiliza un nuevo esquema de respuesta. Este nuevo esquema es diferente y no es compatible con un punto de conexión que carezca del parámetro ExplainerConfig proporcionado.

El tipo MIME de la respuesta es application/json, y la carga de la respuesta se puede decodificar de bytes UTF-8 a un objeto JSON. A continuación se muestra que los miembros de este objeto JSON son los siguientes:

version: la versión del esquema de respuesta en formato de cadena. Por ejemplo, 1.0.
predictions: las predicciones que hace la solicitud son las siguientes:
- content_type: el tipo MIME de las predicciones, en referencia al ContentType de la respuesta del contenedor de modelos.
- data: la cadena de datos de las predicciones entregada como carga de la respuesta del contenedor de modelos a la solicitud.
label_headers: los encabezados de las etiquetas del parámetro LabelHeaders. Esto se proporciona en la configuración del explicador o en la salida del contenedor de modelos.
explanations: las explicaciones que figuran en la carga de la solicitud. Si no se explica ningún registro, este miembro devuelve el objeto {} vacío.
- kernel_shap: una clave que hace referencia a una matriz de explicaciones SHAP del kernel para cada registro de la solicitud. Si un registro no tiene explicación, la explicación correspondiente es null.

El elemento kernel_shap tiene los siguientes miembros:

feature_header: el nombre del encabezado de las características que proporciona el parámetro FeatureHeaders en la configuración del explicador ExplainerConfig.
feature_type: el tipo de característica inferido por el explicador o proporcionado en el parámetro FeatureTypes en ExplainerConfig. Este elemento solo está disponible para problemas de explicabilidad de NLP.
attributions: una matriz de objetos de atribución. Las características de texto pueden tener varios objetos de atribución, cada uno para una unidad. El objeto de atribución tiene los siguientes miembros:
- attribution: una lista de valores de probabilidad, proporcionada para cada clase.
- description: la descripción de las unidades de texto, disponible solo para problemas de explicabilidad de NLP.
  - partial_text: la parte del texto explicada por el explicador.
  - start_idx: un índice de base cero para identificar la ubicación de la matriz al principio del fragmento de texto parcial.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Conjunto de datos sintéticos

Ejemplos de código: SDK para Python