기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
줄 및 텍스트 단어
Amazon Textract 작업에서 반환된 감지된 텍스트는 다음 목록에 반환됩니다.Block객체입니다. 이러한 개체는 문서 페이지에서 감지되는 텍스트 또는 텍스트 단어를 나타냅니다. 다음 텍스트는 여러 단어로 만들어진 두 줄의 텍스트를 보여 줍니다.
이것은 텍스트입니다.
두 줄로 구분됩니다.
감지된 텍스트는 다음 위치에 반환됩니다.Text
필드Block
객체입니다. 이BlockType
필드는 텍스트가 텍스트 줄 (LINE) 인지 또는 단어 (WORD) 인지 결정합니다. A단어는 공백으로 구분되지 않은 하나 이상의 ISO 기본 라틴 스크립트 문자입니다. A선는 탭으로 구분된 연속 단어 문자열입니다.
또한 Amazon Textract Textract는 텍스트를 사용하여 손글씨 또는 인쇄되었는지 여부를 결정합니다.TextTypes
필드. 이들은 각각 필기 및 인쇄로 반환됩니다.
기타Block
특성은 ID, 신뢰 및 지오메트리 정보와 같은 모든 블록 유형에 공통적입니다. 자세한 정보는 텍스트 감지 및 문서 분석 응답 객체을 참조하십시오.
줄과 단어만 감지하려면 다음을 사용할 수 있습니다.DetectDocumentText또는StartDocumentTextDetection. 자세한 정보는 텍스트 감지을 참조하십시오. 감지된 텍스트 (선 및 단어) 와 문서의 다른 부분 (예: 표) 과 관련되는 방법에 대한 정보를 얻으려면 다음을 사용할 수 있습니다.AnalyzeDocument또는StartDocumentAnalysis. 자세한 정보는 문서 분석을 참조하십시오.
PAGE
,LINE
, 및WORD
블록은 상위-하위 관계에서 서로 관련되어 있습니다. APAGE
블록은 모두의 상위입니다.LINE
문서 페이지에서 객체를 차단합니다. LINE에는 하나 이상의 단어가 있을 수 있습니다.Relationships
LINE 블록에 대한 배열은 텍스트 행을 구성하는 하위 WORD 블록의 ID를 저장합니다.
다음 다이어그램은 라인을 보여 줍니다.Hello world.텍스트에서Hello world. 어떻게 지내세요?는 다음과 같이 표시됩니다.Block
객체입니다.
다음은 의 JSON 출력입니다.DetectDocumentText
때 문장Hello world. 어떻게 지내세요?가 감지됩니다. 첫 번째 예제는 문서 페이지의 JSON입니다. 하위 ID를 사용하여 문서를 탐색할 수 있는 방법에 유의하십시오.
{ "Geometry": {...}, "Relationships": [ { "Type": "CHILD", "Ids": [ "d7fbd604-d609-4d69-857d-247a3f591238", // Line - Hello, world. "b6c19a93-6493-4d8e-958f-853c8f7ca055" // Line - How are you? ] } ], "BlockType": "PAGE", "Id": "56ec1d77-171f-4881-9852-2b5b7e761608" },
다음은 “Hello, World”라는 줄을 구성하는 LINE 블록에 대한 JSON입니다.
{ "Relationships": [ { "Type": "CHILD", "Ids": [ "7f97e2ca-063e-47a8-981c-8beee31afc01", // Word - Hello, "4b990aa0-af96-4369-b90f-dbe02538ed21" // Word - world. ] } ], "Confidence": 99.63229370117188, "Geometry": {...}, "Text": "Hello, world.", "BlockType": "LINE", "Id": "d7fbd604-d609-4d69-857d-247a3f591238" },
다음은 단어의 WORD 블록에 대한 JSON입니다.안녕하세요.:
{ "Geometry": {...}, "Text": "Hello,", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.74746704101562, "Id": "7f97e2ca-063e-47a8-981c-8beee31afc01" },
마지막 JSON은 단어의 WORD 블록입니다.세계.:
{ "Geometry": {...}, "Text": "world.", "TextType": "PRINTED", "BlockType": "WORD", "Confidence": 99.5171127319336, "Id": "4b990aa0-af96-4369-b90f-dbe02538ed21" },