Rufen Sie den Endpunkt auf

Nachdem der Endpunkt ausgeführt wurde, verwenden Sie die SageMaker LaufzeitInvokeEndpoint -API im SageMaker Laufzeit-Service, um Anfragen an zu senden oder den Endpunkt aufzurufen. Als Reaktion darauf werden die Anforderungen vom SageMaker Clarify-Erklärer als Erklärbarkeitsanforderungen behandelt.

Anmerkung

Wählen Sie eine der folgenden Optionen aus, um einen Endpunkt aufzurufen:

Anweisungen zur Verwendung von Boto3 oder der AWS CLI zum Aufrufen eines Endpunkts finden Sie unter Rufen Sie Modelle für Inferenz in Echtzeit auf.
Informationen zur Verwendung des SageMaker SDK für Python zum Aufrufen eines Endpunkts finden Sie in der Predictor-API.

Anforderung

Die InvokeEndpoint-API hat einen optionalen Parameter EnableExplanations, der dem HTTP-Header zugeordnet X-Amzn-SageMaker-Enable-Explanations ist. Wenn dieser Parameter angegeben wird, überschreibt er den EnableExplanations-Parameter von ClarifyExplainerConfig.

Anmerkung

Die Parameter ContentType und Accept der InvokeEndpoint-API sind erforderlich. Zu den unterstützten Formaten gehören MIME-Typ text/csv und application/jsonlines.

Verwenden Sie den sagemaker_runtime_client, um wie folgt eine Anfrage an den Endpunkt zu senden:


response = sagemaker_runtime_client.invoke_endpoint(
    EndpointName='name-of-your-endpoint',
    EnableExplanations='`true`',
    ContentType='text/csv',
    Accept='text/csv',
    Body='1,2,3,4',  # single record (of four numerical features)
)

Übergeben Sie für Multimodell-Endpunkte einen zusätzlichen TargetModel Parameter in der vorherigen Beispielanforderung, um anzugeben, auf welches Modell am Endpunkt abgezielt werden soll. Der Multimodell-Endpunkt lädt Zielmodelle nach Bedarf dynamisch. Weitere Informationen zu Multimodell-Endpunkten finden Sie unter Hosten Sie mehrere Modelle in einem Container hinter einem Endpunkt. Ein Beispiel für die Einrichtung und den Aufruf mehrerer Zielmodelle von einem einzigen Endpunkt aus finden Sie im SageMaker Beispiel-Notebook Clarify Online Explainability on Multi-Model Endpoint.

Antwort

Wenn der Endpunkt mit ExplainerConfig erstellt wird, wird ein neues Antwortschema verwendet. Dieses neue Schema unterscheidet sich von einem Endpunkt, für den der angegebene ExplainerConfig-Parameter fehlt und nicht mit diesem kompatibel ist.

Der MIME-Typ der Antwort ist application/json, und die Antwortnutzlast kann von UTF-8-Bytes in ein JSON-Objekt dekodiert werden. Im Folgenden werden die Mitglieder dieses JSON-Objekts wie folgt dargestellt:

version: Die Version des Antwortschemas im Zeichenfolgeformat. Beispiel: 1.0
predictions: Die Vorhersagen, die die Anfrage macht, haben folgende Eigenschaften:
- content_type: Der MIME-Typ der Vorhersagen, der sich auf die Antwort ContentType des Modellcontainers bezieht.
- data: Die Datenzeichenfolge mit den Vorhersagen, die als Nutzlast der Antwort des Modellcontainers für die Anfrage geliefert wurde.
label_headers: Die Label-Header des LabelHeaders-Parameters. Dies wird entweder in der Erklärkonfiguration oder in der Ausgabe des Modellcontainers bereitgestellt.
explanations: Die Erläuterungen finden Sie in der Anforderungsnutzlast. Wenn keine Datensätze erklärt werden, gibt dieses Mitglied das leere Objekt {} zurück.
- kernel_shap: Ein Schlüssel, der sich auf ein Array von Kernel-SHAP-Erklärungen für jeden Datensatz in der Anfrage bezieht. Wenn ein Datensatz nicht erklärt wird, ist die entsprechende Erklärung null.

Das kernel_shap-Element hat die folgenden Mitglieder:

feature_header: Der Header-Name der Funktionen, die durch den FeatureHeaders-Parameter in der Erklärkonfiguration ExplainerConfig bereitgestellt werden.
feature_type: Der Feature-Typ, der vom Erklärer abgeleitet oder im FeatureTypes-Parameter in der ExplainerConfig angegeben wurde. Dieses Element ist nur für NLP-Erklärbarkeitsprobleme verfügbar.
attributions: Eine Reihe von Zuordnungsobjekten. Textmerkmale können mehrere Zuordnungsobjekte haben, jedes für eine Einheit. Das Zuordnungsobjekt hat die folgenden Mitglieder:
- attribution: Eine Liste von Wahrscheinlichkeitswerten, die für jede Klasse angegeben ist.
- description: Die Beschreibung der Texteinheiten, nur für NLP-Erklärbarkeitsprobleme verfügbar.
  - partial_text: Der Teil des Textes, der vom Erklärer erklärt wurde.
  - start_idx: Ein auf Null basierender Index zur Identifizierung der Array-Position am Anfang des partiellen Textfragments.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Einen Endpunkt konfigurieren und erstellen

Codebeispiele: SDK für Python