Echtzeitanalyse für benutzerdefinierte Klassifizierung (API) - Amazon Comprehend

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Echtzeitanalyse für benutzerdefinierte Klassifizierung (API)

Sie können die Amazon Comprehend API verwenden, um eine Echtzeitklassifizierung mit einem benutzerdefinierten Modell durchzuführen. Zunächst erstellen Sie einen Endpunkt, um die Echtzeitanalyse auszuführen. Nachdem Sie den Endpunkt erstellt haben, führen Sie die Echtzeitklassifizierung durch.

Die Beispiele in diesem Abschnitt verwenden Befehlsformate für Unix, Linux und macOS. Ersetzen Sie unter Windows den umgekehrten Schrägstrich (\), das Unix-Fortsetzungszeichen, am Ende jeder Zeile durch ein Caret-Zeichen oder Zirkumflex (^).

Informationen zur Bereitstellung des Endpunktdurchsatzes und zu den damit verbundenen Kosten finden Sie unterVerwenden von Amazon Comprehend-Endpunkten.

Einen Endpunkt für die benutzerdefinierte Klassifizierung erstellen

Das folgende Beispiel zeigt den CreateEndpointAPI-Vorgang unter Verwendung von AWS CLI.

aws comprehend create-endpoint \ --desired-inference-units number of inference units \ --endpoint-name endpoint name \ --model-arn arn:aws:comprehend:region:account-id:model/example \ --tags Key=My1stTag,Value=Value1

Amazon Comprehend antwortet wie folgt:

{ "EndpointArn": "Arn" }

Ausführen einer benutzerdefinierten Klassifizierung in Echtzeit

Nachdem Sie einen Endpunkt für Ihr benutzerdefiniertes Klassifizierungsmodell erstellt haben, verwenden Sie den Endpunkt, um den ClassifyDocumentAPI-Vorgang auszuführen. Sie können Texteingaben mit dem bytes Parameter text oder bereitstellen. Geben Sie die anderen Eingabetypen mithilfe des bytes Parameters ein.

Bei Bild- und PDF-Dateien können Sie den DocumentReaderConfig Parameter verwenden, um die standardmäßigen Textextraktionsaktionen zu überschreiben. Details hierzu finden Sie unter Festlegen von Optionen für die Textextraktion

Die besten Ergebnisse erzielen Sie, wenn Sie den Typ der Eingabe an den Modelltyp des Klassifikators anpassen. Die API-Antwort enthält eine Warnung, wenn Sie ein systemeigenes Dokument an ein Nur-Text-Modell oder eine Nur-Text-Datei an ein systemeigenes Dokumentenmodell senden. Weitere Informationen finden Sie unter Modelle zur Trainingsklassifizierung.

Unter Verwendung der AWS Command Line Interface

Die folgenden Beispiele zeigen, wie der CLI-Befehl classify-document verwendet wird.

Klassifizieren Sie Text mit dem AWS CLI

Im folgenden Beispiel wird eine Echtzeitklassifizierung für einen Textblock ausgeführt.

aws comprehend classify-document \ --endpoint-arn arn:aws:comprehend:region:account-id:endpoint/endpoint name \ --text 'From the Tuesday, April 16th, 1912 edition of The Guardian newspaper: The maiden voyage of the White Star liner Titanic, the largest ship ever launched ended in disaster. The Titanic started her trip from Southampton for New York on Wednesday. Late on Sunday night she struck an iceberg off the Grand Banks of Newfoundland. By wireless telegraphy she sent out signals of distress, and several liners were near enough to catch and respond to the call.'

Amazon Comprehend antwortet wie folgt:

{ "Classes": [ { "Name": "string", "Score": 0.9793661236763 } ] }

Klassifizieren Sie ein halbstrukturiertes Dokument mit dem AWS CLI

Um die benutzerdefinierte Klassifizierung für eine PDF-, Word- oder Bilddatei zu analysieren, führen Sie den classify-document Befehl mit der Eingabedatei im bytes Parameter aus.

Im folgenden Beispiel wird ein Bild als Eingabedatei verwendet. Es verwendet die fileb Option zur Base-64-Kodierung der Bilddatei-Bytes. Weitere Informationen finden Sie unter Binary large objects im AWS Command Line Interface Benutzerhandbuch.

In diesem Beispiel wird auch eine JSON-Datei mit dem Namen A übergebenconfig.json, um die Optionen für die Textextraktion festzulegen.

$ aws comprehend classify-document \ > --endpoint-arn arn \ > --language-code en \ > --bytes fileb://image1.jpg \ > --document-reader-config file://config.json

Die Datei config.json enthält den folgenden Inhalt.

{ "DocumentReadMode": "FORCE_DOCUMENT_READ_ACTION", "DocumentReadAction": "TEXTRACT_DETECT_DOCUMENT_TEXT" }

Amazon Comprehend antwortet wie folgt:

{ "Classes": [ { "Name": "string", "Score": 0.9793661236763 } ] }

Weitere Informationen finden Sie ClassifyDocumentin der Amazon Comprehend API-Referenz.