Salidas para trabajos de análisis asíncronos - Amazon Comprehend

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Salidas para trabajos de análisis asíncronos

Una vez finalizado un trabajo de análisis, almacena los resultados en el bucket de S3 que especificó en la solicitud.

Salidas para entradas de texto

En el caso de los archivos de entrada de texto, la salida consiste en una lista de entidades para cada documento de entrada.

El siguiente ejemplo muestra la salida de dos documentos de un archivo de entrada denominado 50_docs, utilizando un formato de documento por línea.

{ "File": "50_docs", "Line": 0, "Entities": [ { "BeginOffset": 0, "EndOffset": 22, "Score": 0.9763959646224976, "Text": "John Johnson", "Type": "JUDGE" } ] } { "File": "50_docs", "Line": 1, "Entities": [ { "BeginOffset": 11, "EndOffset": 15, "Score": 0.9615424871444702, "Text": "Thomas Kincaid", "Type": "JUDGE" } ] }

Salidas para entradas semiestructuradas

En el caso de los documentos de entrada semiestructurados, la salida puede incluir los siguientes campos adicionales:

  • DocumentMetadata — Extracción de información sobre el documento. Los metadatos incluyen una lista de páginas del documento, con el número de caracteres extraídos de cada página. Este campo está presente en la respuesta si la solicitud incluía el parámetro Byte.

  • DocumentType — El tipo de documento para cada página del documento de entrada. Este campo está presente en la respuesta para una solicitud que incluía el parámetro Byte.

  • Bloques: información sobre cada bloque de texto del documento de entrada. Los bloques pueden agruparse dentro de un bloque. Un bloque de página contiene un bloque para cada línea de texto, que contiene un bloque para cada palabra. Este campo está presente en la respuesta para una solicitud que incluía el parámetro Byte.

  • BlockReferences — Una referencia a cada bloque de esta entidad. Este campo está presente en la respuesta para una solicitud que incluía el parámetro Byte. El campo no está presente para los archivos de texto.

  • Errores: errores a nivel de la página que el sistema detectó al procesar el documento de entrada. El campo está vacío si el sistema no ha detectado ningún error.

Para obtener más información sobre estos campos de salida, consulte la DetectEntitiesreferencia de la API Amazon Comprehend

En el siguiente ejemplo se muestra el resultado de un documento de entrada de PDF original de una página.

ejemplo Ejemplo de salida de un análisis de reconocimiento de entidades personalizado de un documento PDF
{ "Blocks": [ { "BlockType": "LINE", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "4330efed-6334-4fc4-ba48-e050afa95c8d", "Page": 1, "Relationships": [ { "ids": [ "f343ce48-583d-4abe-b84b-a232e266450f" ], "type": "CHILD" } ], "Text": "S-3" }, { "BlockType": "WORD", "Geometry": { "BoundingBox": { "Height": 0.012575757575757575, "Left": 0.0, "Top": 0.0015063131313131314, "Width": 0.02262091503267974 }, "Polygon": [ { "X": 0.0, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.0015063131313131314 }, { "X": 0.02262091503267974, "Y": 0.014082070707070706 }, { "X": 0.0, "Y": 0.014082070707070706 } ] }, "Id": "f343ce48-583d-4abe-b84b-a232e266450f", "Page": 1, "Relationships": [], "Text": "S-3" } ], "DocumentMetadata": { "PageNumber": 1, "Pages": 1 }, "DocumentType": "NativePDF", "Entities": [ { "BlockReferences": [ { "BeginOffset": 25, "BlockId": "4330efed-6334-4fc4-ba48-e050afa95c8d", "ChildBlocks": [ { "BeginOffset": 1, "ChildBlockId": "cbba5534-ac69-4bc4-beef-306c659f70a6", "EndOffset": 6 } ], "EndOffset": 30 } ], "Score": 0.9998825926329088, "Text": "0.001", "Type": "OFFERING_PRICE" }, { "BlockReferences": [ { "BeginOffset": 41, "BlockId": "f343ce48-583d-4abe-b84b-a232e266450f", "ChildBlocks": [ { "BeginOffset": 0, "ChildBlockId": "292a2e26-21f0-401b-a2bf-03aa4c47f787", "EndOffset": 9 } ], "EndOffset": 50 } ], "Score": 0.9809727537330395, "Text": "6,097,560", "Type": "OFFERED_SHARES" } ], "File": "example.pdf", "Version": "2021-04-30" }