Invoque o endpoint - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Invoque o endpoint

Depois que o endpoint estiver em execução, use a InvokeEndpointAPI SageMaker Runtime no serviço SageMaker Runtime para enviar solicitações ou invocar o endpoint. Em resposta, as solicitações são tratadas como solicitações de explicabilidade pelo explicador do SageMaker Clarify.

nota

Para chamar um endpoint, escolha uma das seguintes opções:

Solicitação

A API InvokeEndpoint tem um parâmetro opcional EnableExplanations, que é mapeado para o cabeçalho X-Amzn-SageMaker-Enable-Explanations HTTP. Se esse parâmetro for fornecido, ele substituirá o parâmetro EnableExplanations do ClarifyExplainerConfig.

nota

Os parâmetros ContentType e Accept da API InvokeEndpoint são necessários. Os formatos suportados incluem o tipo MIME text/csv e application/jsonlines.

Use o sagemaker_runtime_client para enviar uma solicitação ao endpoint, da seguinte forma:

response = sagemaker_runtime_client.invoke_endpoint( EndpointName='name-of-your-endpoint', EnableExplanations='`true`', ContentType='text/csv', Accept='text/csv', Body='1,2,3,4', # single record (of four numerical features) )

Para endpoints de vários modelos, passe um TargetModel parâmetro adicional na solicitação do exemplo anterior para especificar qual modelo deve ser direcionado ao endpoint. O endpoint de vários modelos carrega dinamicamente os modelos de destino conforme necessário. Para obter mais informações sobre endpoints de vários modelos, consulte. Hospedar vários modelos em um contêiner atrás de um endpoint Consulte o caderno de amostra SageMaker Clarify Online Explicability on Multimodel Endpoint para obter um exemplo de como configurar e invocar vários modelos de destino a partir de um único endpoint.

Resposta

Se o endpoint for criado com ExplainerConfig, um novo esquema de resposta será usado. Esse novo esquema é diferente e não é compatível com um endpoint que não tem o parâmetro fornecido ExplainerConfig.

O tipo MIME da resposta é application/json, e a carga útil da resposta pode ser decodificada de bytes UTF-8 para um objeto JSON. Veja a seguir que os membros desse objeto JSON são os seguintes:

  • version: a versão do esquema de resposta em formato de string. Por exemplo, 1.0.

  • predictions: as previsões que a solicitação faz são as seguintes:

    • content_type: o tipo MIME das previsões, referindo-se à ContentType da resposta do contêiner do modelo.

    • data: a sequência de dados de previsões fornecida como carga útil da resposta do contêiner do modelo para a solicitação.

  • label_headers: os cabeçalhos do rótulo do parâmetro LabelHeaders. Isso é fornecido na configuração do explicador ou na saída do contêiner do modelo.

  • explanations: as explicações fornecidas na carga da solicitação. Se nenhum registro for explicado, esse membro retornará o objeto vazio {}.

    • kernel_shap: uma chave que se refere a uma matriz de explicações do Kernel SHAP para cada registro na solicitação. Se um registro não for explicado, a explicação correspondente será null.

O elemento kernel_shap tem os seguintes membros:

  • feature_header: o nome do cabeçalho dos recursos fornecidos pelo parâmetro FeatureHeaders na configuração do explicador ExplainerConfig.

  • feature_type: o tipo de recurso inferido pelo explicador ou fornecido no parâmetro FeatureTypes no ExplainerConfig. Esse elemento só está disponível para problemas de explicabilidade da PNL.

  • attributions: uma matriz de objetos de atribuição. Os recursos de texto podem ter vários objetos de atribuição, cada um para uma unidade. O objeto de atribuição tem os seguintes membros:

    • attribution: uma lista de valores de probabilidade, fornecida para cada classe.

    • description: a descrição das unidades de texto, disponível somente para problemas de explicabilidade da PNL.

      • partial_text: a parte do texto explicada pelo explicador.

      • start_idx: um índice baseado em zero para identificar a localização da matriz no início do fragmento de texto parcial.