Objets de réponse Détection de texte et analyse de documents - Amazon Textract

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Objets de réponse Détection de texte et analyse de documents

Lorsque Amazon Textract traite un document, il crée une liste deBlockobjets pour le texte détecté ou analysé. Chaque bloc contient des informations sur un article détecté, où il se trouve, et la confiance d'Amazon Textract dans la précision du traitement.

Un document est composé des types suivants deBlockobjets.

Le contenu d'un bloc dépend de l'opération que vous appelez. Si vous appelez l'une des opérations de détection de texte, les pages, les lignes et les mots du texte détecté sont renvoyés. Pour plus d'informations, consultez Détection de texte. Si vous appelez l'une des opérations d'analyse de documents, des informations sur les pages détectées, les paires clé-valeur, les tableaux, les éléments de sélection et le texte sont renvoyées. Pour plus d'informations, consultez Analyse des documents.

MomentanéeBlockLes champs d'objets sont communs aux deux types de traitement. Par exemple, chaque bloc possède un identifiant unique.

Pour obtenir des exemples illustrant l'utilisationBlockobjets, voirTutoriels.

Disposition du document

Amazon Textract renvoie une représentation d'un document sous forme de liste de différents types deBlockobjets liés dans une relation parent-enfant ou une paire clé-valeur. Les métadonnées indiquant le nombre de pages d'un document sont également renvoyées. Voici le JSON d'un type typeBlockobjet de typePAGE.

{ "Blocks": [ { "Geometry": { "BoundingBox": { "Width": 1.0, "Top": 0.0, "Left": 0.0, "Height": 1.0 }, "Polygon": [ { "Y": 0.0, "X": 0.0 }, { "Y": 0.0, "X": 1.0 }, { "Y": 1.0, "X": 1.0 }, { "Y": 1.0, "X": 0.0 } ] }, "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", "82aedd57-187f-43dd-9eb1-4f312ca30042", "52be1777-53f7-42f6-a7cf-6d09bdc15a30", "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" }..... ], "DocumentMetadata": { "Pages": 1 } }

Un document est fabriqué à partir d'un ou plusieursPAGE. Chaque page contient une liste de blocs enfants pour les éléments principaux détectés sur la page, tels que des lignes de texte et des tableaux. Pour plus d'informations, consultez Pages.

Vous pouvez déterminer le type d'objetBlocken inspectant l'objetBlockType.

UNBlockcontient une liste deBlockobjets dans leRelationships, qui est un tableau deRelationshipobjets. UNRelationshipstableau est soit de type CHILD, soit de type VALUE. Un tableau de type CHILD permet de répertorier les éléments enfants du bloc actuel. Par exemple, si le bloc actuel est de type LINE,Relationshipscontient une liste d'ID des blocs WORD qui composent la ligne de texte. Un tableau de type VALUE est utilisé pour contenir des paires clé-valeur. Vous pouvez déterminer le type de relation en inspectant leTypedu champRelationshipobjet.

Les blocs enfants ne contiennent pas d'informations sur leurs objets Block parents.

Pour des exemples qui montrentBlock, consultezTraitement de documents avec des opérations synchrone.

Fiabilité

Les opérations Amazon Textract indiquent le pourcentage de fiabilité déterminé par Amazon Textract pour l'exactitude de l'article détecté. Pour obtenir la confiance, utilisez leConfidencedu champBlockobjet. Une valeur supérieure indique une confiance supérieure. Selon le scénario, les détections avec une faible confiance peuvent nécessiter une confirmation visuelle de la part d'un humain.

Geometry

Les opérations Amazon Textract, à l'exception de l'analyse d'identité, renvoient des informations de localisation concernant l'emplacement des éléments détectés sur une page de document. Pour obtenir cet emplacement, utilisez leGeometrydu champBlockobjet. Pour de plus amples informations, veuillez consulterEmplacement de l'article sur une page de document