실시간 분석을 위한 출력 - Amazon Comprehend

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

실시간 분석을 위한 출력

텍스트 입력을 위한 출력

Text파라미터를 사용하여 텍스트를 입력하면 분석에서 감지한 개체 배열이 출력됩니다. 다음 예는 JUDGE 개체 두 개를 탐지한 분석을 보여줍니다.

{ "Entities": [ { "BeginOffset": 0, "EndOffset": 22, "Score": 0.9763959646224976, "Text": "John Johnson", "Type": "JUDGE" }, { "BeginOffset": 11, "EndOffset": 15, "Score": 0.9615424871444702, "Text": "Thomas Kincaid", "Type": "JUDGE" } ] }

반구조화된 입력을 위한 출력

반정형 입력 문서 또는 텍스트 파일의 경우 출력에 다음과 같은 추가 필드가 포함될 수 있습니다.

  • DocumentMetadata — 문서에 대한 추출 정보 메타데이터에는 문서의 페이지 목록과 각 페이지에서 추출한 문자 수가 포함됩니다. 요청에 Byte 파라미터가 포함된 경우 응답에 이 필드가 표시됩니다.

  • DocumentType — 입력 문서에 있는 각 페이지의 문서 유형입니다. 요청에 Byte 파라미터가 포함된 경우 응답에 이 필드가 표시됩니다.

  • 블록 — 입력 문서에 있는 각 텍스트 블록에 대한 정보입니다. 블록은 중첩됩니다. 페이지 블록에는 각 텍스트 라인에 대한 블록이 포함되며, 이 블록에는 각 단어에 대한 블록이 포함됩니다. 요청에 Byte 파라미터가 포함된 경우 응답에 이 필드가 표시됩니다.

  • BlockReferences — 이 엔티티의 각 블록에 대한 참조. 요청에 Byte 파라미터가 포함된 경우 응답에 이 필드가 표시됩니다. 텍스트 파일에는 이 필드가 없습니다.

  • 오류(Errors) — 입력 문서를 처리하는 동안 시스템에서 감지한 페이지 수준 오류입니다. 시스템에서 오류가 발생하지 않으면 이 필드는 비어 있습니다.

이러한 출력 필드에 대한 설명은 Amazon Comprehend API 참조를 참조하십시오 DetectEntities. 레이아웃 요소에 대한 자세한 내용은 Amazon Textract 개발자 사용서의 Amazon Textract 분석 객체를 참조하십시오.

다음 예제는 한 페이지의 PDF 스캔 입력 문서의 출력을 보여줍니다.

{ "Entities": [{ "Score": 0.9984670877456665, "Type": "DATE-TIME", "Text": "September 4,", "BlockReferences": [{ "BlockId": "42dcaaee-c484-4b5d-9e3f-ae0be928b3e1", "BeginOffset": 0, "EndOffset": 12, "ChildBlocks": [{ "ChildBlockId": "6e9cbb43-f8be-4da0-9a4b-ff9a6c350a14", "BeginOffset": 0, "EndOffset": 9 }, { "ChildBlockId": "599e0d53-ae9f-491b-a762-459b22c79ff5", "BeginOffset": 0, "EndOffset": 2 }, { "ChildBlockId": "599e0d53-ae9f-491b-a762-459b22c79ff5", "BeginOffset": 0, "EndOffset": 2 } ] }] }], "DocumentMetadata": { "Pages": 1, "ExtractedCharacters": [{ "Page": 1, "Count": 609 }] }, "DocumentType": [{ "Page": 1, "Type": "SCANNED_PDF" }], "Blocks": [{ "Id": "ee82edf3-28de-4d63-8883-40e2e4938ccb", "BlockType": "LINE", "Text": "Your Band", "Page": 1, "Geometry": { "BoundingBox": { "Height": 0.024125460535287857, "Left": 0.11745482683181763, "Top": 0.06821706146001816, "Width": 0.12074867635965347 }, "Polygon": [{ "X": 0.11745482683181763, "Y": 0.06821706146001816 }, { "X": 0.2382034957408905, "Y": 0.06821706146001816 }, { "X": 0.2382034957408905, "Y": 0.09234252572059631 }, { "X": 0.11745482683181763, "Y": 0.09234252572059631 } ] }, "Relationships": [{ "Ids": [ "b105c561-c8d9-485a-a728-7a5b1a308935", "60ecb119-3173-4de2-8c5d-de182a5f86a5" ], "Type": "CHILD" }] }] }

다음 예제는 네이티브 PDF 문서 분석에 대한 출력을 보여줍니다.

예 PDF 문서의 사용자 정의 개체 인식 분석 결과 예제
{ "Blocks": [ { "BlockType": "LINE", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "4330efed-6334-4fc4-ba48-e050afa95c8d", "Page": 1, "Relationships": [ { "ids": [ "f343ce48-583d-4abe-b84b-a232e266450f" ], "type": "CHILD" } ], "Text": "S-3" }, { "BlockType": "WORD", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "f343ce48-583d-4abe-b84b-a232e266450f", "Page": 1, "Relationships": [], "Text": "S-3" } ], "DocumentMetadata": { "PageNumber": 1, "Pages": 1 }, "DocumentType": "NativePDF", "Entities": [ { "BlockReferences": [ { "BeginOffset": 25, "BlockId": "4330efed-6334-4fc4-ba48-e050afa95c8d", "ChildBlocks": [ { "BeginOffset": 1, "ChildBlockId": "cbba5534-ac69-4bc4-beef-306c659f70a6", "EndOffset": 6 } ], "EndOffset": 30 } ], "Score": 0.9998825926329088, "Text": "0.001", "Type": "OFFERING_PRICE" }, { "BlockReferences": [ { "BeginOffset": 41, "BlockId": "f343ce48-583d-4abe-b84b-a232e266450f", "ChildBlocks": [ { "BeginOffset": 0, "ChildBlockId": "292a2e26-21f0-401b-a2bf-03aa4c47f787", "EndOffset": 9 } ], "EndOffset": 50 } ], "Score": 0.9809727537330395, "Text": "6,097,560", "Type": "OFFERED_SHARES" } ], "File": "example.pdf", "Version": "2021-04-30" }