비동기 분석 작업을 위한 출력 - Amazon Comprehend

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

비동기 분석 작업을 위한 출력

분석 작업이 완료되면 요청에서 지정한 S3 버킷에 결과가 저장됩니다.

텍스트 입력을 위한 출력

텍스트 입력 파일의 경우 출력은 각 입력 문서의 항목 목록으로 구성됩니다.

다음 예제에서는 라인 형식 당 하나의 문서 형태로 50_docs 이름의 입력 파일에 대한 출력 문서 2개를 보여줍니다.

{ "File": "50_docs", "Line": 0, "Entities": [ { "BeginOffset": 0, "EndOffset": 22, "Score": 0.9763959646224976, "Text": "John Johnson", "Type": "JUDGE" } ] } { "File": "50_docs", "Line": 1, "Entities": [ { "BeginOffset": 11, "EndOffset": 15, "Score": 0.9615424871444702, "Text": "Thomas Kincaid", "Type": "JUDGE" } ] }

반구조화된 입력을 위한 출력

반정형 입력 문서의 경우 출력에 다음과 같은 추가 필드가 포함될 수 있습니다.

  • DocumentMetadata — 문서에 대한 추출 정보 메타데이터에는 문서의 페이지 목록과 각 페이지에서 추출한 문자 수가 포함됩니다. 요청에 Byte 파라미터가 포함된 경우 응답에 이 필드가 표시됩니다.

  • DocumentType — 입력 문서에 있는 각 페이지의 문서 유형입니다. 요청에 Byte 파라미터가 포함된 경우 응답에 이 필드가 표시됩니다.

  • 블록 — 입력 문서에 있는 각 텍스트 블록에 대한 정보입니다. 블록은 블록 안에 중첩될 수 있습니다. 페이지 블록에는 각 텍스트 라인에 대한 블록이 포함되며, 이 블록에는 각 단어에 대한 블록이 포함됩니다. 요청에 Byte 파라미터가 포함된 경우 응답에 이 필드가 표시됩니다.

  • BlockReferences — 이 엔티티의 각 블록에 대한 참조. 요청에 Byte 파라미터가 포함된 경우 응답에 이 필드가 표시됩니다. 텍스트 파일에는 이 필드가 없습니다.

  • 오류(Errors) — 입력 문서를 처리하는 동안 시스템에서 감지한 페이지 수준 오류입니다. 시스템에서 오류가 발생하지 않으면 이 필드는 비어 있습니다.

이러한 출력 필드에 대한 자세한 내용은 Amazon Comprehend API 참조를 참조하십시오 DetectEntities.

다음 예제에서는 한 페이지 분량의 네이티브 PDF 입력 문서의 출력을 보여줍니다.

예 PDF 문서의 사용자 정의 개체 인식 분석 결과 예제
{ "Blocks": [ { "BlockType": "LINE", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "4330efed-6334-4fc4-ba48-e050afa95c8d", "Page": 1, "Relationships": [ { "ids": [ "f343ce48-583d-4abe-b84b-a232e266450f" ], "type": "CHILD" } ], "Text": "S-3" }, { "BlockType": "WORD", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "f343ce48-583d-4abe-b84b-a232e266450f", "Page": 1, "Relationships": [], "Text": "S-3" } ], "DocumentMetadata": { "PageNumber": 1, "Pages": 1 }, "DocumentType": "NativePDF", "Entities": [ { "BlockReferences": [ { "BeginOffset": 25, "BlockId": "4330efed-6334-4fc4-ba48-e050afa95c8d", "ChildBlocks": [ { "BeginOffset": 1, "ChildBlockId": "cbba5534-ac69-4bc4-beef-306c659f70a6", "EndOffset": 6 } ], "EndOffset": 30 } ], "Score": 0.9998825926329088, "Text": "0.001", "Type": "OFFERING_PRICE" }, { "BlockReferences": [ { "BeginOffset": 41, "BlockId": "f343ce48-583d-4abe-b84b-a232e266450f", "ChildBlocks": [ { "BeginOffset": 0, "ChildBlockId": "292a2e26-21f0-401b-a2bf-03aa4c47f787", "EndOffset": 9 } ], "EndOffset": 50 } ], "Score": 0.9809727537330395, "Text": "6,097,560", "Type": "OFFERED_SHARES" } ], "File": "example.pdf", "Version": "2021-04-30" }