GetDocumentAnalysis - Amazon Textract

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

GetDocumentAnalysis

문서의 텍스트를 분석하는 Amazon Textract 비동기 작업의 결과를 가져옵니다.

다음을 호출하여 비동기 텍스트 분석을 시작합니다.StartDocumentAnalysis를 반환하는 작업 식별자 (JobId). 텍스트 분석 작업이 완료되면 Amazon Textract Textract는 초기 호출에 등록된 Amazon Simple Notification Service (Amazon SNS) 주제에 완료 상태를 게시합니다.StartDocumentAnalysis. 텍스트 감지 작업의 결과를 얻으려면 먼저 Amazon SNS 주제에 게시된 상태 값이 다음과 같은지 확인하십시오.SUCCEEDED. 그렇다면 전화하십시오.GetDocumentAnalysis작업 식별자를 전달하고 (JobId) 초기 통화부터StartDocumentAnalysis.

GetDocumentAnalysis의 배열을 반환합니다.Block객체. 다음 정보 유형이 반환됩니다.

  • 양식 데이터 (키-값 쌍). 관련 정보는 2개로 반환됩니다.Block객체, 각 유형KEY_VALUE_SET: 키Block객체 및 값Block객체. 예,이름: 아나 실바 캐롤라이나에는 키와 값이 포함되어 있습니다. 이름:열쇠입니다. 아나 실바 캐롤라이나이 값입니다.

  • 테이블 및 테이블 셀 데이터입니다. 테이블Block객체에는 탐지된 테이블에 대한 정보가 들어 있습니다. 셀Block테이블의 각 셀에 대해 객체가 반환됩니다.

  • 줄 및 텍스트 단어. 줄 바꿈Block객체가 하나 이상의 WORD가 포함되어 있습니다.Block객체. 문서에서 감지된 모든 줄과 단어가 반환됩니다 (텍스트 포함).StartDocumentAnalysis FeatureTypes입력 매개 변수).

확인란 및 옵션 버튼 (라디오 버튼) 과 같은 선택 요소는 양식 데이터 및 테이블에서 감지할 수 있습니다. 셀렉션_엘리먼트Block객체에는 선택 상태를 포함하여 선택 요소에 대한 정보가 들어 있습니다.

사용MaxResults파라미터를 사용하여 반환되는 블록 수를 제한합니다. 에 지정된 것보다 많은 결과가 있는 경우MaxResults, 의 가치NextToken작업 응답에는 다음 결과 집합을 가져오기 위한 페이지 지정 토큰이 포함되어 있습니다. 결과의 다음 페이지를 가져오려면GetDocumentAnalysis를 채우고NextToken이전 호출에서 반환된 토큰 값이 있는 요청 매개 변수GetDocumentAnalysis.

자세한 내용은 단원을 참조하십시오.문서 텍스트 분석.

요청 구문

{ "JobId": "string", "MaxResults": number, "NextToken": "string" }

요청 파라미터

요청은 JSON 형식의 다음 데이터를 받습니다.

JobId

텍스트 감지 작업의 고유 식별자입니다. 이JobId에서 반환됩니다.StartDocumentAnalysis. AJobId값은 7일 동안만 유효합니다.

Type: String

길이 제약 조건: 최소 길이는 1이고, 최대 길이 64.

Pattern: ^[a-zA-Z0-9-_]+$

: 필수 프로세스는 페이지 쓰기 후 세그먼트화된 가장 오래전에 사용된(SLRU) 데이터가 내구성 있는 스토리지에 도달할 때까지 기다리고 있습니다.

MaxResults

페이지가 지정된 호출당 반환할 최대 결과 수입니다. 지정할 수 있는 가장 큰 값은 1,000입니다. 1,000보다 큰 값을 지정한 경우 최대 1,000개의 결과가 반환됩니다. 기본값은 1000입니다.

Type: 정수

유효 범위: 최소값 1.

: 필수 아니요

NextToken

이전 응답이 불완전한 경우 (검색할 블록이 더 많기 때문에) Amazon Textract Textract는 응답에 페이지 매김 토큰을 반환합니다. 이 페이지 매김 토큰을 사용하여 다음 블록 세트를 검색할 수 있습니다.

Type: String

길이 제약 조건: 최소 길이는 1이고, 최대 길이 255.

Pattern: .*\S.*

: 필수 아니요

응답 구문

{ "AnalyzeDocumentModelVersion": "string", "Blocks": [ { "BlockType": "string", "ColumnIndex": number, "ColumnSpan": number, "Confidence": number, "EntityTypes": [ "string" ], "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Id": "string", "Page": number, "Relationships": [ { "Ids": [ "string" ], "Type": "string" } ], "RowIndex": number, "RowSpan": number, "SelectionStatus": "string", "Text": "string", "TextType": "string" } ], "DocumentMetadata": { "Pages": number }, "JobStatus": "string", "NextToken": "string", "StatusMessage": "string", "Warnings": [ { "ErrorCode": "string", "Pages": [ number ] } ] }

응답 요소

작업이 성공하면 서비스가 HTTP 200 응답을 다시 전송합니다.

다음 데이터는 서비스에 의해 JSON 형식으로 반환됩니다.

AnalyzeDocumentModelVersion

Type: String

Blocks

텍스트 분석 작업의 결과입니다.

Type: 배열Block사물

DocumentMetadata

Amazon Textract Textract가 처리한 문서에 대한 정보입니다.DocumentMetadata는 Amazon Textract 비디오 작업에서 페이지 매겨진 응답의 모든 페이지에서 반환됩니다.

유형: DocumentMetadata 객체

JobStatus

텍스트 검색 작업의 현재 상태입니다.

Type: String

유효한 값: IN_PROGRESS | SUCCEEDED | FAILED | PARTIAL_SUCCESS

NextToken

응답이 잘린 경우 Amazon Textract Textract는 이 토큰을 반환합니다. 이 토큰을 후속 요청에서 사용하여 다음 텍스트 검색 결과 집합을 가져올 수 있습니다.

Type: String

길이 제약 조건: 최소 길이는 1이고, 최대 길이 255.

Pattern: .*\S.*

StatusMessage

검색 작업을 완료할 수 없는 경우 반환합니다. 발생한 오류에 대한 설명이 들어 있습니다.

Type: String

Warnings

문서 분석 작업 중에 발생한 경고 목록입니다.

Type: 배열Warning사물

오류

AccessDeniedException

작업을 수행할 권한이 없습니다. 권한 있는 사용자 또는 IAM 역할의 Amazon 리소스 이름(ARN)을 사용하여 작업을 수행하십시오.

HTTP 상태 코드: 400

InternalServerError

Amazon Textract Textract에 서비스 문제가 발생했습니다. 호출을 다시 시도하십시오.

HTTP 상태 코드: 500

InvalidJobIdException

잘못된 작업 식별자가 에 전달되었습니다.GetDocumentAnalysis또는GetDocumentAnalysis.

HTTP 상태 코드: 400

InvalidKMSKeyException

KMS 키를 입력한 상태에서 암호 해독 권한이 없거나 KMS 키가 잘못 입력되었음을 나타냅니다.

HTTP 상태 코드: 400

InvalidParameterException

입력 파라미터가 제약 조건을 위반했습니다. 예를 들어, 동기 작업에서는InvalidParameterException예외가 발생하지 않을 때S3Object또는Bytes값은 다음 위치에 제공됩니다.Document요청 파라미터입니다. 파라미터를 확인한 다음 API 작업을 다시 호출하십시오.

HTTP 상태 코드: 400

InvalidS3ObjectException

Amazon Textract 이 요청에서 지정된 S3 객체에 액세스할 수 없습니다. 자세한 내용은Amazon S3 액세스 구성문제 해결 정보는 를 참조하십시오.Amazon S3 문제 해결

HTTP 상태 코드: 400

ProvisionedThroughputExceededException

요청의 수가 처리량 한도를 초과했습니다. 이 한도를 늘려야 하는 경우 Amazon Textract Textract에 문의하십시오.

HTTP 상태 코드: 400

ThrottlingException

Amazon Textract 이 요청을 일시적으로 처리할 수 없습니다. 호출을 다시 시도하십시오.

HTTP 상태 코드: 500

참고 항목

이 API를 언어별 AWS SDK 중 하나로 사용하는 방법에 대한 자세한 내용은 다음을 참조하세요.