양식 데이터 (키-값 쌍) - Amazon Textract

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

양식 데이터 (키-값 쌍)

Amazon Textract Textract는 문서에서 양식 데이터를 키-값 페어로 추출할 수 있습니다. 예를 들어 다음 텍스트에서 Amazon Textract Textract가 키를 식별할 수 있습니다.이름:) 및 값 (아나 캐롤라이나).

이름: 아나 캐롤라이나

감지된 키-값 페어는Block응답의 객체AnalyzeDocumentGetDocumentAnalysis. 이FeatureTypes키-값 쌍, 테이블 또는 둘 다에 대한 정보를 검색하는 입력 매개 변수입니다. 키-값 쌍에만 해당 값을 사용하십시오.FORMS. 문제 해결 예는 양식 문서에서 키-값 쌍 추출을(를) 참조하십시오. 문서를 표현하는 방법에 대한 일반 정보Block객체, 참조텍스트 감지 및 문서 분석 응답 객체.

KEY_VALUE_SET 유형을 가진 블록 객체는 문서에서 탐지된 링크된 텍스트 항목에 대한 정보를 저장하는 KEY 또는 VALUE 블록 객체의 컨테이너입니다. 이EntityType블록이 KEY인지 VALUE인지 여부를 결정하는 속성입니다.

  • Aobject는 링크된 텍스트의 키에 대한 정보를 포함합니다. 예,이름:. KEY 블록에는 두 개의 관계 목록이 있습니다. VALUE 유형의 관계는 키와 연관된 VALUE 블록의 ID를 포함하는 목록입니다. CHILD 유형의 관계는 키의 텍스트를 구성하는 WORD 블록의 ID 목록입니다.

  • A객체에는 키와 연결된 텍스트에 대한 정보가 들어 있습니다. 이전 예제에서아나 캐롤라이나키의 값입니다.이름:. VALUE 블록은 WORD 블록을 식별하는 자식 블록 목록과 관계가 있습니다. 각 WORD 블록에는 값의 텍스트를 구성하는 단어 중 하나가 포함되어 있습니다. AVALUE객체에는 선택한 요소에 대한 정보도 포함될 수 있습니다. 자세한 정보는 선택 요소을 참조하십시오.

KEY_VALUE_SET의 각 인스턴스Block객체는 PAGE의 하위입니다.Block현재 페이지에 해당하는 객체입니다.

다음 다이어그램은 키-값 페어의 방식을 보여 줍니다.이름: 아나 캐롤라이나는 다음과 같이 표시됩니다.Block객체입니다.

다음 예제에서는 키-값 페어의 방식을 보여 줍니다.이름: 아나 캐롤라이나는 JSON으로 표시됩니다.

PAGE 블록에는 유형의 하위 블록이 있습니다.KEY_VALUE_SET문서에서 감지된 각 KEY 및 VALUE 블록에 대해

{ "Geometry": .... "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", "82aedd57-187f-43dd-9eb1-4f312ca30042", "52be1777-53f7-42f6-a7cf-6d09bdc15a30", // Key - Name: "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value - Ana Caroline ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" // Page identifier },

다음 JSON은 키 블록 (52베1777-53f7-42f6-A7cF-6d09BDC15A30) 이 밸류 블록 (7ca6-00ef-4CDA-바1AA-5571dfed1a7c) 과의 관계가 있음을 보여줍니다. 또한 키에 대한 텍스트가 포함 된 워드 블록 (c734fca6-c4c4-415c-b6c1-30f7510b72ee) 에 대한 자식 블록이 있습니다.이름:).

{ "Relationships": [ { "Type": "VALUE", "Ids": [ "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier ] }, { "Type": "CHILD", "Ids": [ "c734fca6-c4c4-415c-b6c1-30f7510b72ee" // Name: ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "KEY" ], "Id": "52be1777-53f7-42f6-a7cf-6d09bdc15a30" //Key identifier },

다음 JSON은 값 블록 7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c가 값의 텍스트를 구성하는 WORD 블록에 대한 ID의 자식 목록을 가지고 있음을 보여줍니다.애나캐롤라이나).

{ "Relationships": [ { "Type": "CHILD", "Ids": [ "db553509-64ef-4ecf-ad3c-bea62cc1cd8a", // Ana "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" // Carolina ] } ], "Confidence": 51.55965805053711, "Geometry": ...., "BlockType": "KEY_VALUE_SET", "EntityTypes": [ "VALUE" ], "Id": "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" // Value identifier }

다음 JSON은Block단어를 위한 객체이름:,애나, 및캐롤라이나.

{ "Geometry": {...}, "Text": "Name:", "TextType": "PRINTED". "BlockType": "WORD", "Confidence": 99.56285858154297, "Id": "c734fca6-c4c4-415c-b6c1-30f7510b72ee" }, { "Geometry": {...}, "Text": "Ana", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.52057647705078, "Id": "db553509-64ef-4ecf-ad3c-bea62cc1cd8a" }, { "Geometry": {...}, "Text": "Carolina", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.84207916259766, "Id": "e5d7646c-eaa2-413a-95ad-f4ae19f53ef3" },