As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Dados do formulário (pares de chave-valor)
Amazon Textract pode extrair dados de formulário de documentos como pares de chave-valor. Por exemplo, no texto a seguir, o Amazon Textract pode identificar uma chave (Name (Nome):) e um valor (Ana Carolina).
Name (Nome): Ana Carolina
Os pares de chave-valor são retornados comoBlockobjetos nas respostas deAnalyzeDocumenteGetDocumentAnalysis. Você pode usar oFeatureTypes
parâmetro de entrada para recuperar informações sobre pares de valores-chave, tabelas ou ambos. Apenas para pares de chave-valor, use o valorFORMS
. Para ver um exemplo, consulte Extraindo pares de valores-chave de um documento de formulário. Para obter informações gerais sobre como um documento é representado porBlock
objetos, consulteObjetos de resposta de detecção de texto e análise de.
Objetos de bloco com o tipo KEY_VALUE_SET são os contêineres para objetos KEY ou VALUE Block que armazenam informações sobre itens de texto vinculados detectados em um documento. Você pode usar oEntityType
atributo para determinar se um bloco é KEY ou VALUE.
-
UMACHAVEO objeto contém informações sobre a chave do texto vinculado. Por exemplo,Name (Nome):. Um bloco KEY tem duas listas de relacionamento. Um relacionamento do tipo VALUE é uma lista que contém o ID do bloco VALUE associado à chave. Um relacionamento do tipo CHILD é uma lista de IDs para os blocos WORD que compõem o texto da chave.
-
UMAVALORO objeto contém informações sobre o texto associado a uma chave. No exemplo anterior,Ana Carolinaé o valor da chaveName (Nome):. Um bloco VALUE tem um relacionamento com uma lista de blocos CHILD que identificam blocos WORD. Cada bloco WORD contém uma das palavras que compõem o texto do valor. UMA
VALUE
Objetos também podem conter informações sobre elementos selecionados. Para obter mais informações, consulte Elementos de seleção.
Cada instância de um KEY_VALUE_SETBlock
O objeto é um filho do PAGEBlock
objeto que corresponde à página atual.
O diagrama a seguir mostra como o par de chave-valorName (Nome): Ana Carolinaé representado porBlock
objects.
Os exemplos a seguir mostram como o par de chave-valorName (Nome): Ana Carolinaé representado por JSON.
O bloco PAGE tem blocos CHILD do tipoKEY_VALUE_SET
para cada bloco KEY e VALUE detectado no documento.
{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", "82aedd57-187f-43dd-9eb1-4f312ca30042", "52be1777-53f7-42f6-a7cf-6d09bdc15a30", // Key - Name: "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value - Ana Caroline ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },
O JSON a seguir mostra que o bloco KEY (52be1777-53f7-42f6-a7cf-6d09bdc15a30) tem uma relação com o bloco VALUE (7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c). Ele também tem um bloco CHILD para o bloco WORD (c734fca6-c4c4-415c-b6c1-30f7510b72ee) que contém o texto da chave (Name (Nome):).
{ "Relationships": [ { "Type": "VALUE", "Ids": [ "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier ] }, { "Type": "CHILD", "Ids": [ "c734fca6-c4c4-415c-b6c1-30f7510b72ee" // Name: ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "KEY" ], "Id": "52be1777-53f7-42f6-a7cf-6d09bdc15a30" //Key identifier },
O JSON a seguir mostra que o bloco VALUE 7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c tem uma lista CHILD de IDs para os blocos WORD que compõem o texto do valor (AnaeCarolina).
{ "Relationships": [ { "Type": "CHILD", "Ids": [ "db553509-64ef-4ecf-ad3c-bea62cc1cd8a", // Ana "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" // Carolina ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "VALUE" ], "Id": "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier }
O JSON a seguir mostra oBlock
objetos para as palavrasName (Nome):,Ana, eCarolina.
{ "Geometry": {...}, "Text": "Name:", "TextType": "PRINTED". "BlockType": "WORD", "Confidence": 99.56285858154297, "Id": "c734fca6-c4c4-415c-b6c1-30f7510b72ee" }, { "Geometry": {...}, "Text": "Ana", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.52057647705078, "Id": "db553509-64ef-4ecf-ad3c-bea62cc1cd8a" }, { "Geometry": {...}, "Text": "Carolina", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.84207916259766, "Id": "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" },