Sorties pour les tâches d'analyse asynchrones - Amazon Comprehend

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Sorties pour les tâches d'analyse asynchrones

Une fois le travail d'analyse terminé, il stocke les résultats dans le compartiment S3 que vous avez spécifié dans la demande.

Sorties pour entrées de texte

Pour les fichiers de saisie de texte, la sortie consiste en une liste d'entités pour chaque document d'entrée.

L'exemple suivant montre la sortie de deux documents à partir d'un fichier d'entrée nommé50_docs, en utilisant un format de document par ligne.

{ "File": "50_docs", "Line": 0, "Entities": [ { "BeginOffset": 0, "EndOffset": 22, "Score": 0.9763959646224976, "Text": "John Johnson", "Type": "JUDGE" } ] } { "File": "50_docs", "Line": 1, "Entities": [ { "BeginOffset": 11, "EndOffset": 15, "Score": 0.9615424871444702, "Text": "Thomas Kincaid", "Type": "JUDGE" } ] }

Sorties pour entrées semi-structurées

Pour les documents d'entrée semi-structurés, la sortie peut inclure les champs supplémentaires suivants :

  • DocumentMetadata — Informations d'extraction relatives au document. Les métadonnées incluent une liste de pages du document, avec le nombre de caractères extraits de chaque page. Ce champ est présent dans la réponse si la demande inclut le Byte paramètre.

  • DocumentType — Type de document pour chaque page du document d'entrée. Ce champ est présent dans la réponse à une demande incluant le Byte paramètre.

  • Blocs : informations relatives à chaque bloc de texte du document d'entrée. Les blocs peuvent s'imbriquer dans un bloc. Un bloc de page contient un bloc pour chaque ligne de texte, qui contient un bloc pour chaque mot. Ce champ est présent dans la réponse à une demande incluant le Byte paramètre.

  • BlockReferences — Une référence à chaque bloc pour cette entité. Ce champ est présent dans la réponse à une demande incluant le Byte paramètre. Le champ n'est pas présent pour les fichiers texte.

  • Erreurs : erreurs au niveau de la page détectées par le système lors du traitement du document d'entrée. Le champ est vide si le système n'a détecté aucune erreur.

Pour plus de détails sur ces champs de sortie, consultez DetectEntitiesle manuel Amazon Comprehend API Reference

L'exemple suivant montre le résultat d'un document d'entrée PDF natif d'une page.

Exemple de résultat d'une analyse de reconnaissance d'entités personnalisée d'un document PDF
{ "Blocks": [ { "BlockType": "LINE", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "4330efed-6334-4fc4-ba48-e050afa95c8d", "Page": 1, "Relationships": [ { "ids": [ "f343ce48-583d-4abe-b84b-a232e266450f" ], "type": "CHILD" } ], "Text": "S-3" }, { "BlockType": "WORD", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "f343ce48-583d-4abe-b84b-a232e266450f", "Page": 1, "Relationships": [], "Text": "S-3" } ], "DocumentMetadata": { "PageNumber": 1, "Pages": 1 }, "DocumentType": "NativePDF", "Entities": [ { "BlockReferences": [ { "BeginOffset": 25, "BlockId": "4330efed-6334-4fc4-ba48-e050afa95c8d", "ChildBlocks": [ { "BeginOffset": 1, "ChildBlockId": "cbba5534-ac69-4bc4-beef-306c659f70a6", "EndOffset": 6 } ], "EndOffset": 30 } ], "Score": 0.9998825926329088, "Text": "0.001", "Type": "OFFERING_PRICE" }, { "BlockReferences": [ { "BeginOffset": 41, "BlockId": "f343ce48-583d-4abe-b84b-a232e266450f", "ChildBlocks": [ { "BeginOffset": 0, "ChildBlockId": "292a2e26-21f0-401b-a2bf-03aa4c47f787", "EndOffset": 9 } ], "EndOffset": 50 } ], "Score": 0.9809727537330395, "Text": "6,097,560", "Type": "OFFERED_SHARES" } ], "File": "example.pdf", "Version": "2021-04-30" }