Datos de formulario (pares clave-valor) - Amazon Textract

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Datos de formulario (pares clave-valor)

Amazon Texact puede extraer datos de formulario de documentos en pares clave-valor. Por ejemplo, en el siguiente texto, Amazon Textract puede identificar una clave (Name:) y un valor (Ana Carolina).

Name: Ana Carolina

Los pares clave-valor detectados se devuelven comoBlockobjetos en las respuestas deAnalyzeDocumentyGetDocumentAnalysis. Puede utilizar elFeatureTypesparámetro de entrada para recuperar información sobre pares clave-valor, tablas o ambos. Solo para pares clave-valor, utilice el valorFORMS. Para ver un ejemplo, consulte Extracción de pares clave-valor de un documento de formulario. Para obtener información general sobre cómo un documento está representado porBlockobjetos, consulteObjetos de respuesta de detección de texto y análisis de documentos.

Los objetos de bloque con el tipo KEY_VALUE_SET son los contenedores de los objetos KEY o VALUE Block que almacenan información sobre los elementos de texto vinculados detectados en un documento. Puede utilizar elEntityTypepara determinar si un bloque es KEY o VALUE.

  • UNACLAVEobjeto contiene información sobre la clave del texto vinculado. Por ejemplo,Name:. Un bloque KEY tiene dos listas de relaciones. Una relación de tipo VALUE es una lista que contiene el ID del bloque VALUE asociado a la clave. Una relación de tipo CHILD es una lista de ID de los bloques WORD que componen el texto de la clave.

  • UNAVALUEobjeto contiene información sobre el texto asociado a una clave. En el modelo de ejemplo anterior,Ana Carolinaes el valor de la claveName:. Un bloque VALUE tiene una relación con una lista de bloques CHILD que identifican bloques WORD. Cada bloque WORD contiene una de las palabras que componen el texto del valor. UNAVALUEEl objeto también puede contener información sobre los elementos seleccionados. Para obtener más información, consulte Elementos de selección.

Cada instancia de un KEY_VALUE_SETBlockes un elemento secundario de la PAGEBlockobjeto que corresponde a la página actual.

En el siguiente diagrama se muestra cómo el par clave-valorName: Ana Carolinaestá representado porBlockobjects.

En los siguientes ejemplos se muestra cómo el par clave-valorName: Ana Carolinaestá representado por JSON.

El bloque PAGE tiene bloques CHILD de tipoKEY_VALUE_SETpara cada bloque KEY y VALUE detectados en el documento.

{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", "82aedd57-187f-43dd-9eb1-4f312ca30042", "52be1777-53f7-42f6-a7cf-6d09bdc15a30", // Key - Name: "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value - Ana Caroline ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },

El siguiente JSON muestra que el bloque KEY (52be1777-53f7-42f6-a7cf-6d09bdc15a30) tiene una relación con el bloque VALUE (7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c). También tiene un bloque CHILD para el bloque WORD (c734fca6-c4c4-415c-b6c1-30f7510b72ee) que contiene el texto de la clave (Name:).

{ "Relationships": [ { "Type": "VALUE", "Ids": [ "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier ] }, { "Type": "CHILD", "Ids": [ "c734fca6-c4c4-415c-b6c1-30f7510b72ee" // Name: ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "KEY" ], "Id": "52be1777-53f7-42f6-a7cf-6d09bdc15a30" //Key identifier },

El siguiente JSON muestra que el bloque VALUE 7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c tiene una lista SECUNDARIA de ID para los bloques WORD que componen el texto del valor (AnayCarolina).

{ "Relationships": [ { "Type": "CHILD", "Ids": [ "db553509-64ef-4ecf-ad3c-bea62cc1cd8a", // Ana "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" // Carolina ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "VALUE" ], "Id": "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier }

El siguiente JSON muestra elBlockobjetos para las palabrasName:,Ana, yCarolina.

{ "Geometry": {...}, "Text": "Name:", "TextType": "PRINTED". "BlockType": "WORD", "Confidence": 99.56285858154297, "Id": "c734fca6-c4c4-415c-b6c1-30f7510b72ee" }, { "Geometry": {...}, "Text": "Ana", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.52057647705078, "Id": "db553509-64ef-4ecf-ad3c-bea62cc1cd8a" }, { "Geometry": {...}, "Text": "Carolina", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.84207916259766, "Id": "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" },