Ausgaben für asynchrone Analyseaufträge - Amazon Comprehend

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Ausgaben für asynchrone Analyseaufträge

Nachdem ein Analyseauftrag abgeschlossen ist, speichert er die Ergebnisse in dem S3-Bucket, den Sie in der Anforderung angegeben haben.

Ausgaben für Texteingaben

Bei Texteingabedateien besteht die Ausgabe aus einer Liste von Entitäten für jedes Eingabedokument.

Das folgende Beispiel zeigt die Ausgabe für zwei Dokumente aus einer Eingabedatei mit dem Namen 50_docs, wobei ein Dokument pro Zeilenformat verwendet wird.

{ "File": "50_docs", "Line": 0, "Entities": [ { "BeginOffset": 0, "EndOffset": 22, "Score": 0.9763959646224976, "Text": "John Johnson", "Type": "JUDGE" } ] } { "File": "50_docs", "Line": 1, "Entities": [ { "BeginOffset": 11, "EndOffset": 15, "Score": 0.9615424871444702, "Text": "Thomas Kincaid", "Type": "JUDGE" } ] }

Ausgaben für halbstrukturierte Eingaben

Bei halbstrukturierten Eingabedokumenten kann die Ausgabe die folgenden zusätzlichen Felder enthalten:

  • DocumentMetadata – Extraktionsinformationen über das Dokument. Die Metadaten enthalten eine Liste von Seiten im Dokument mit der Anzahl der von jeder Seite extrahierten Zeichen. Dieses Feld ist in der Antwort vorhanden, wenn die Anforderung den Byte Parameter enthielt.

  • DocumentType – Der Dokumenttyp für jede Seite im Eingabedokument. Dieses Feld ist in der Antwort für eine Anforderung vorhanden, die den Byte Parameter enthält.

  • Blöcke – Informationen zu jedem Textblock im Eingabedokument. Blöcke können innerhalb eines Blocks verschachtelt werden. Ein Seitenblock enthält einen Block für jede Textzeile, der einen Block für jedes Wort enthält. Dieses Feld ist in der Antwort für eine Anforderung vorhanden, die den Byte Parameter enthält.

  • BlockReferences – Ein Verweis auf jeden Block für diese Entität. Dieses Feld ist in der Antwort für eine Anforderung vorhanden, die den Byte Parameter enthält. Das Feld ist für Textdateien nicht vorhanden.

  • Fehler – Fehler auf Seitenebene, die das System bei der Verarbeitung des Eingabedokuments erkannt hat. Das Feld ist leer, wenn das System keine Fehler festgestellt hat.

Weitere Informationen zu diesen Ausgabefeldern finden Sie unter DetectEntities in der Amazon Comprehend API-Referenz.

Das folgende Beispiel zeigt die Ausgabe für ein einseitiges natives PDF-Eingabedokument.

Beispielausgabe einer benutzerdefinierten Entitätserkennungsanalyse eines PDF-Dokuments
{ "Blocks": [ { "BlockType": "LINE", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "4330efed-6334-4fc4-ba48-e050afa95c8d", "Page": 1, "Relationships": [ { "ids": [ "f343ce48-583d-4abe-b84b-a232e266450f" ], "type": "CHILD" } ], "Text": "S-3" }, { "BlockType": "WORD", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "f343ce48-583d-4abe-b84b-a232e266450f", "Page": 1, "Relationships": [], "Text": "S-3" } ], "DocumentMetadata": { "PageNumber": 1, "Pages": 1 }, "DocumentType": "NativePDF", "Entities": [ { "BlockReferences": [ { "BeginOffset": 25, "BlockId": "4330efed-6334-4fc4-ba48-e050afa95c8d", "ChildBlocks": [ { "BeginOffset": 1, "ChildBlockId": "cbba5534-ac69-4bc4-beef-306c659f70a6", "EndOffset": 6 } ], "EndOffset": 30 } ], "Score": 0.9998825926329088, "Text": "0.001", "Type": "OFFERING_PRICE" }, { "BlockReferences": [ { "BeginOffset": 41, "BlockId": "f343ce48-583d-4abe-b84b-a232e266450f", "ChildBlocks": [ { "BeginOffset": 0, "ChildBlockId": "292a2e26-21f0-401b-a2bf-03aa4c47f787", "EndOffset": 9 } ], "EndOffset": 50 } ], "Score": 0.9809727537330395, "Text": "6,097,560", "Type": "OFFERED_SHARES" } ], "File": "example.pdf", "Version": "2021-04-30" }