Block - Amazon Textract

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Block

ABlock는 서로 가까운 픽셀 그룹 내의 문서에서 인식되는 항목을 나타냅니다. 에서 반환되는 정보Block객체는 작업 유형에 따라 다릅니다. 문서에 대한 텍스트 감지 (예:DetectDocumentText) 를 선택하면 검색된 단어와 텍스트 줄에 대한 정보를 얻을 수 있습니다. 텍스트 분석 (예:AnalyzeDocument) 을 사용하면 문서에서 검색된 필드, 테이블 및 선택 요소에 대한 정보도 얻을 수 있습니다.

의 어레이Block객체는 동기 및 비동기 작업 모두에 의해 반환됩니다. 동기식 작업 (예:DetectDocumentText의 배열Block객체는 전체 결과 집합입니다. 비동기 작업 (예:GetDocumentAnalysis를 선택하면 하나 이상의 응답을 통해 배열이 반환됩니다.

자세한 내용은 단원을 참조하십시오.Amazon Textract 작동 방식.

목차

BlockType

인식되는 텍스트 항목의 유형입니다. 텍스트 감지 작업에서 다음 유형이 반환됩니다.

  • 페이지- LINE 목록이 포함되어 있습니다.Block문서 페이지에서 감지된 개체입니다.

  • 단어- 문서 페이지에서 감지된 단어입니다. 단어는 공백으로 구분되지 않은 하나 이상의 ISO 기본 라틴 스크립트 문자입니다.

  • - 문서 페이지에서 감지되는 탭으로 구분된 연속 단어 문자열입니다.

텍스트 분석 작업에서는 다음 유형이 반환됩니다.

  • 페이지- 하위 목록이 포함되어 있습니다.Block문서 페이지에서 감지된 개체입니다.

  • 키_값_세트- 키 및 가치 저장Block문서 페이지에서 감지된 링크된 텍스트의 개체입니다. 사용EntityTypeKEY_VALUE_SET 객체가 키인지 확인하는 필드Block객체 또는 값Block객체입니다.

  • 단어- 문서 페이지에서 감지된 단어입니다. 단어는 공백으로 구분되지 않은 하나 이상의 ISO 기본 라틴 스크립트 문자입니다.

  • - 문서 페이지에서 감지되는 탭으로 구분된 연속 단어 문자열입니다.

  • - 문서 페이지에서 감지된 테이블입니다. 테이블은 두 개 이상의 행이나 열이 있는 그리드 기반 정보로, 셀 범위는 한 행과 각각 하나의 열로 구성됩니다.

  • 세포- 감지된 테이블 내의 셀입니다. 셀은 셀의 텍스트를 포함하는 블록의 상위입니다.

  • 선택_요소- 옵션 버튼 (라디오 버튼) 또는 문서 페이지에서 감지된 확인란과 같은 선택 요소 다음 값을 사용합니다.SelectionStatus선택 요소의 상태를 확인할 수 있습니다.

Type: String

유효한 값: KEY_VALUE_SET | PAGE | LINE | WORD | TABLE | CELL | SELECTION_ELEMENT

: 필수 아니요

ColumnIndex

테이블 셀이 나타나는 열입니다. 첫 번째 열 위치는 1입니다.ColumnIndex는 반환되지 않습니다.DetectDocumentTextGetDocumentTextDetection.

Type: 정수

유효한 범위: 최소값 0.

: 필수 아니요

ColumnSpan

테이블 셀이 걸쳐있는 열 수입니다. 현재 이 값은 스팬된 열 수가 1보다 큰 경우에도 항상 1입니다.ColumnSpan는 반환되지 않습니다.DetectDocumentTextGetDocumentTextDetection.

Type: 정수

유효한 범위: 최소값 0.

: 필수 아니요

Confidence

인식된 텍스트의 정확도와 인식된 텍스트 주위의 지오메트리 포인트의 정확성에 대해 Amazon Textract Textract의 신뢰도 점수입니다.

Type: 부동 소수점

유효한 범위: 최소값 0. 최대값 100입니다.

: 필수 아니요

EntityTypes

엔터티의 유형입니다. 다음을 반환할 수 있습니다.

  • - 문서의 필드에 대한 식별자입니다.

  • - 필드 텍스트입니다.

EntityTypes는 반환되지 않습니다.DetectDocumentTextGetDocumentTextDetection.

Type: 문자열 배열

유효한 값: KEY | VALUE

: 필수 아니요

Geometry

이미지에서 인식된 텍스트의 위치입니다. 여기에는 텍스트를 둘러싸는 축 정렬된 거친 경계 상자와 보다 정확한 공간 정보를 위한 미세한 다각형이 포함되어 있습니다.

유형: Geometry 객체

: 필수 아니요

Id

인식된 텍스트의 식별자입니다. 식별자는 단일 작업에 대해서만 고유합니다.

Type: String

Pattern: .*\S.*

: 필수 아니요

Page

블록이 감지된 페이지입니다.Page는 비동기 작업에 의해 반환됩니다. 1보다 큰 페이지 값은 PDF 또는 TIFF 형식의 여러 페이지 문서에 대해서만 반환됩니다. 스캔한 이미지 (JPEG/PNG) 는 여러 문서 페이지가 포함되어 있더라도 단일 페이지 문서로 간주됩니다. 의 가치Page는 항상 1입니다. 동기식 작업이 반환되지 않음Page모든 입력 문서는 단일 페이지 문서로 간주되기 때문입니다.

Type: 정수

유효한 범위: 최소값 0.

: 필수 아니요

Relationships

현재 블록의 하위 블록 목록입니다. 예를 들어 LINE 객체에는 텍스트 줄의 일부인 각 WORD 블록에 대한 하위 블록이 있습니다. 현재 블록에 하위 블록이 없는 경우와 같이 존재하지 않는 관계에 대한 관계 객체가 목록에 없습니다. 목록 크기는 다음과 같습니다.

  • 0 - 블록에 하위 블록이 없습니다.

  • 1 - 블록에 하위 블록이 있습니다.

Type: 배열Relationship사물

: 필수 아니요

RowIndex

테이블 셀이 있는 행입니다. 첫 번째 행 위치는 1입니다.RowIndex는 반환되지 않습니다.DetectDocumentTextGetDocumentTextDetection.

Type: 정수

유효한 범위: 최소값 0.

: 필수 아니요

RowSpan

테이블 셀의 행 수입니다. 현재 이 값은 스팬된 행 수가 1보다 크더라도 항상 1입니다.RowSpan는 반환되지 않습니다.DetectDocumentTextGetDocumentTextDetection.

Type: 정수

유효한 범위: 최소값 0.

: 필수 아니요

SelectionStatus

옵션 버튼이나 확인란과 같은 선택 요소의 선택 상태입니다.

Type: String

유효한 값: SELECTED | NOT_SELECTED

: 필수 아니요

Text

Amazon Textract Textract에서 인식하는 단어 또는 텍스트 행입니다.

Type: String

: 필수 아니요

TextType

Amazon Textract Textract가 감지한 텍스트의 종류입니다. 필기 텍스트와 인쇄된 텍스트를 확인할 수 있습니다.

Type: String

유효한 값: HANDWRITING | PRINTED

: 필수 아니요

참고 항목

이 API를 언어별 AWS SDK 중 하나로 사용하는 방법에 대한 자세한 내용은 다음을 참조하세요.