Dados do formulário (pares de chave-valor) - Amazon Textract

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Dados do formulário (pares de chave-valor)

Amazon Textract pode extrair dados de formulário de documentos como pares de chave-valor. Por exemplo, no texto a seguir, o Amazon Textract pode identificar uma chave (Name (Nome):) e um valor (Ana Carolina).

Name (Nome): Ana Carolina

Os pares de chave-valor são retornados comoBlockobjetos nas respostas deAnalyzeDocumenteGetDocumentAnalysis. Você pode usar oFeatureTypesparâmetro de entrada para recuperar informações sobre pares de valores-chave, tabelas ou ambos. Apenas para pares de chave-valor, use o valorFORMS. Para ver um exemplo, consulte Extraindo pares de valores-chave de um documento de formulário. Para obter informações gerais sobre como um documento é representado porBlockobjetos, consulteObjetos de resposta de detecção de texto e análise de.

Objetos de bloco com o tipo KEY_VALUE_SET são os contêineres para objetos KEY ou VALUE Block que armazenam informações sobre itens de texto vinculados detectados em um documento. Você pode usar oEntityTypeatributo para determinar se um bloco é KEY ou VALUE.

  • UMACHAVEO objeto contém informações sobre a chave do texto vinculado. Por exemplo,Name (Nome):. Um bloco KEY tem duas listas de relacionamento. Um relacionamento do tipo VALUE é uma lista que contém o ID do bloco VALUE associado à chave. Um relacionamento do tipo CHILD é uma lista de IDs para os blocos WORD que compõem o texto da chave.

  • UMAVALORO objeto contém informações sobre o texto associado a uma chave. No exemplo anterior,Ana Carolinaé o valor da chaveName (Nome):. Um bloco VALUE tem um relacionamento com uma lista de blocos CHILD que identificam blocos WORD. Cada bloco WORD contém uma das palavras que compõem o texto do valor. UMAVALUEObjetos também podem conter informações sobre elementos selecionados. Para obter mais informações, consulte Elementos de seleção.

Cada instância de um KEY_VALUE_SETBlockO objeto é um filho do PAGEBlockobjeto que corresponde à página atual.

O diagrama a seguir mostra como o par de chave-valorName (Nome): Ana Carolinaé representado porBlockobjects.

Os exemplos a seguir mostram como o par de chave-valorName (Nome): Ana Carolinaé representado por JSON.

O bloco PAGE tem blocos CHILD do tipoKEY_VALUE_SETpara cada bloco KEY e VALUE detectado no documento.

{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", "82aedd57-187f-43dd-9eb1-4f312ca30042", "52be1777-53f7-42f6-a7cf-6d09bdc15a30", // Key - Name: "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value - Ana Caroline ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },

O JSON a seguir mostra que o bloco KEY (52be1777-53f7-42f6-a7cf-6d09bdc15a30) tem uma relação com o bloco VALUE (7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c). Ele também tem um bloco CHILD para o bloco WORD (c734fca6-c4c4-415c-b6c1-30f7510b72ee) que contém o texto da chave (Name (Nome):).

{ "Relationships": [ { "Type": "VALUE", "Ids": [ "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier ] }, { "Type": "CHILD", "Ids": [ "c734fca6-c4c4-415c-b6c1-30f7510b72ee" // Name: ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "KEY" ], "Id": "52be1777-53f7-42f6-a7cf-6d09bdc15a30" //Key identifier },

O JSON a seguir mostra que o bloco VALUE 7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c tem uma lista CHILD de IDs para os blocos WORD que compõem o texto do valor (AnaeCarolina).

{ "Relationships": [ { "Type": "CHILD", "Ids": [ "db553509-64ef-4ecf-ad3c-bea62cc1cd8a", // Ana "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" // Carolina ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "VALUE" ], "Id": "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier }

O JSON a seguir mostra oBlockobjetos para as palavrasName (Nome):,Ana, eCarolina.

{ "Geometry": {...}, "Text": "Name:", "TextType": "PRINTED". "BlockType": "WORD", "Confidence": 99.56285858154297, "Id": "c734fca6-c4c4-415c-b6c1-30f7510b72ee" }, { "Geometry": {...}, "Text": "Ana", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.52057647705078, "Id": "db553509-64ef-4ecf-ad3c-bea62cc1cd8a" }, { "Geometry": {...}, "Text": "Carolina", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.84207916259766, "Id": "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" },