Données de formulaire (paires clé-valeur) - Amazon Textract

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Données de formulaire (paires clé-valeur)

Amazon Textract peut extraire les données de formulaire de documents sous forme de paires clé-valeur. Par exemple, dans le texte suivant, Amazon Textract peut identifier une clé (Name :) et une valeur (Ana Caroline).

Name : Ana Caroline

Les paires clé-valeur détectées sont renvoyées sous forme deBlockobjets dans les réponses deAnalyzeDocumentetGetDocumentAnalysis. Vous pouvez utiliser le pluginFeatureTypesparamètre d'entrée pour récupérer des informations sur les paires clé-valeur, les tables ou les deux. Pour les paires clé-valeur uniquement, utilisez la valeurFORMS. Pour voir un exemple, consultez Extraction de paires clé-valeur à partir d'un document de formulaire. Pour obtenir des informations générales sur la représentation d'un documentBlockobjets, voirObjets de réponse Détection de texte et analyse de documents.

Les objets Block de type KEY_VALUE_SET sont les conteneurs des objets KEY ou VALUE Block qui stockent des informations sur les éléments de texte liés détectés dans un document. Vous pouvez utiliser le pluginEntityTypepour déterminer si un bloc est une CLÉ ou une VALEUR.

  • UNCLÉObjets contient des informations sur la clé du texte lié. Par exemple,Name :. Un bloc KEY comporte deux listes de relations. Une relation de type VALUE est une liste contenant l'ID du bloc VALUE associé à la clé. Une relation de type CHILD est une liste d'ID des blocs WORD qui composent le texte de la clé.

  • UNVALEURObjets contient des informations sur le texte associé à une clé. Dans l'exemple précédent,Ana Carolinereprésente la valeur de la cléName :. Un bloc VALUE a une relation avec une liste de blocs CHILD qui identifient les blocs WORD. Chaque bloc WORD contient l'un des mots qui composent le texte de la valeur. UNVALUEObjets peuvent également contenir des informations sur les éléments sélectionnés. Pour plus d'informations, consultez Éléments de sélection.

Chaque instance d'un KEY_VALUE_SETBlockest un enfant de la pageBlockobjet correspondant à la page actuelle.

Le schéma suivant montre comment la paire clé-valeurName : Ana Carolineest représenté parBlockobjets.

Les exemples suivants montrent comment la paire clé-valeurName : Ana Carolineest représenté par JSON.

Le bloc PAGE comporte des blocs CHILD de typeKEY_VALUE_SETpour chaque bloc KEY et VALUE détecté dans le document.

{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", "82aedd57-187f-43dd-9eb1-4f312ca30042", "52be1777-53f7-42f6-a7cf-6d09bdc15a30", // Key - Name: "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value - Ana Caroline ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },

Le JSON suivant indique que le bloc KEY (52be1777-53f7-42f6-a7cf-6d09bdc15a30) a une relation avec le bloc VALUE (7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c). Il possède également un bloc CHILD pour le bloc WORD (c734fca6-c4c4-415c-b6c1-30f7510b72ee) qui contient le texte de la clé (Name :).

{ "Relationships": [ { "Type": "VALUE", "Ids": [ "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier ] }, { "Type": "CHILD", "Ids": [ "c734fca6-c4c4-415c-b6c1-30f7510b72ee" // Name: ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "KEY" ], "Id": "52be1777-53f7-42f6-a7cf-6d09bdc15a30" //Key identifier },

Le JSON suivant indique que le bloc VALUE 7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c possède une liste ENFANT d'ID pour les blocs WORD qui composent le texte de la valeur (AnaetCaroline).

{ "Relationships": [ { "Type": "CHILD", "Ids": [ "db553509-64ef-4ecf-ad3c-bea62cc1cd8a", // Ana "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" // Carolina ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "VALUE" ], "Id": "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier }

Le fichier JSON suivant affiche leBlockobjets pour les motsName :,Ana, etCaroline.

{ "Geometry": {...}, "Text": "Name:", "TextType": "PRINTED". "BlockType": "WORD", "Confidence": 99.56285858154297, "Id": "c734fca6-c4c4-415c-b6c1-30f7510b72ee" }, { "Geometry": {...}, "Text": "Ana", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.52057647705078, "Id": "db553509-64ef-4ecf-ad3c-bea62cc1cd8a" }, { "Geometry": {...}, "Text": "Carolina", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.84207916259766, "Id": "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" },