Predicciones para datos de documentos - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Predicciones para datos de documentos

En los siguientes procedimientos se describe cómo hacer predicciones tanto individuales como por lotes para conjuntos de datos de documentos. Cada Ready-to-use modelo admite predicciones individuales y predicciones por lotes para su conjunto de datos. Una Predicción única sirve cuando solo necesita hacer una predicción. Por ejemplo, si tiene una imagen de la que desea extraer texto o un párrafo de texto en el que desea detectar el idioma dominante. Una Predicción por lotes sirve cuando quiere hacer predicciones para un conjunto de datos completo. Por ejemplo, puede tener un archivo CSV con valoraciones de clientes en las que querría analizar la opinión general de los clientes, o puedes tener archivos de imágenes en los que querría detectar objetos.

Puede utilizar estos procedimientos para los siguientes tipos de Ready-to-use modelos: análisis de gastos, análisis de documentos de identidad y análisis de documentos.

nota

Para las consultas de documentos, actualmente solo se admiten predicciones únicas.

Predicciones únicas

Para realizar una predicción única para Ready-to-use los modelos que aceptan datos de documentos, haga lo siguiente:

  1. En el panel de navegación izquierdo de la aplicación Canvas, elija eady-to-usemodelos R.

  2. En la página de Ready-to-use modelos, elija el Ready-to-use modelo para su caso de uso. En el caso de los datos de documentos, debe ser uno de los siguientes: análisis de gastos, análisis de documentos de identidad o análisis de documentos.

  3. En la página Ejecutar predicciones del Ready-to-use modelo elegido, elija Predicción única.

  4. Si su Ready-to-use modelo es un análisis de documentos de identidad o un análisis de documentos, complete las siguientes acciones. Si está realizando un análisis de gastos o consultas de documentos, omita este paso y vaya al paso 5 o al paso 6, respectivamente.

    1. Seleccione Cargar documento.

    2. Se le solicitará que cargue un archivo PDF, JPG o PNG desde su equipo local. Seleccione el documento de sus archivos locales y, a continuación, se generarán los resultados de la predicción.

  5. Si su Ready-to-use modelo es un análisis de gastos, haga lo siguiente:

    1. Seleccione Cargar factura o recibo.

    2. Se le solicitará que cargue un archivo PDF, JPG, PNG o TIFF desde su equipo local. Seleccione el documento de sus archivos locales y, a continuación, se generarán los resultados de la predicción.

  6. Si su Ready-to-use modelo consiste en consultas de documentos, haga lo siguiente:

    1. Seleccione Cargar documento.

    2. Se le solicitará que cargue un archivo PDF desde su equipo local. Seleccione el documento de sus archivos locales. El PDF debe tener entre 1 y 100 páginas.

      nota

      Si se encuentra en las regiones Asia-Pacífico (Seúl), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney) o Europa (Fráncfort), el tamaño máximo del PDF para las consultas de documentos es de 20 páginas.

    3. En el panel lateral derecho, introduzca consultas para buscar información en el documento. El número de caracteres que puede tener una sola consulta es de 1 a 200. Puede agregar hasta 15 consultas a la vez.

    4. Seleccione Enviar consultas y, a continuación, se generarán los resultados con las respuestas a sus consultas. Se le facturará una vez por cada envío de consultas que realice.

En el panel derecho, en Resultados de la predicción, recibirá un análisis de su documento.

La siguiente información describe los resultados de cada tipo de solución:

  • Para el análisis de gastos, los resultados se clasifican en Campos de resumen, que incluyen campos como el total de un recibo, y Campos de partidas, que incluyen campos como los elementos individuales de un recibo. Los campos identificados aparecen resaltados en la imagen del documento en el resultado.

  • Para el análisis de los documentos de identidad, el resultado muestra los campos que identificó el Ready-to-use modelo, como el nombre y apellidos, la dirección o la fecha de nacimiento. Los campos identificados aparecen resaltados en la imagen del documento en el resultado.

  • Para el análisis de documentos, los resultados se clasifican en texto sin formato, formularios, tablas y firmas. El texto sin formato incluye todo el texto extraído, mientras que los formularios, las tablas y las firmas solo incluyen la información del formulario que pertenezca a esas categorías. Por ejemplo, las tablas solo incluyen la información extraída de las tablas del documento. Los campos identificados aparecen resaltados en la imagen del documento en el resultado.

  • Para las consultas de documentos, Canvas devuelve las respuestas a cada una de sus consultas. Puede abrir el menú desplegable de consultas para ver un resultado, junto con la puntuación de confianza de la predicción. Si Canvas encuentra varias respuestas en el documento, es posible que aparezca más de un resultado para cada consulta.

La siguiente captura de pantalla muestra los resultados de una sola predicción utilizando la solución de análisis de documentos.

Captura de pantalla de los resultados de una sola predicción con el Ready-to-use modelo de análisis de documentos.

Predicciones por lotes

Para realizar predicciones por lotes para Ready-to-use los modelos que aceptan datos de documentos, haga lo siguiente:

  1. En el panel de navegación izquierdo de la aplicación Canvas, elija eady-to-usemodelos R.

  2. En la página de Ready-to-use modelos, elija el Ready-to-use modelo para su caso de uso. En el caso de los datos de imágenes, debe ser uno de los siguientes: análisis de gastos, análisis de documentos de identidad o análisis de documentos.

  3. En la página Ejecutar predicciones del Ready-to-use modelo elegido, elija Predicción por lotes.

  4. Elija Seleccionar conjunto de datos si ya ha importado su conjunto de datos. Si no es así, seleccione Importar un nuevo conjunto de datos y, a continuación, se le guiará a lo largo del flujo de trabajo de importación de datos.

  5. En la lista de conjuntos de datos disponibles, seleccione su conjunto de datos y elija Generar predicciones. Si su caso de uso es el análisis de documentos, continúe con el paso 6.

  6. (Opcional) Si su caso de uso es el análisis de documentos, aparecerá otro cuadro de diálogo denominado Seleccione las características que desee incluir en la predicción por lotes. Puede seleccionar formularios, tablas y firmas para agrupar los resultados por esas características. A continuación, elija Generar predicciones.

Cuando termine de ejecutarse el trabajo de predicción, en la página Ejecutar predicciones, verá un conjunto de datos de salida en la sección Predicciones. Este conjunto de datos contiene los resultados y, si selecciona el icono Más opciones ( Vertical ellipsis icon representing a menu or more options. ), puede seleccionar Ver resultados de predicción para ver una vista previa de los datos del análisis de su documento.

La siguiente información describe los resultados de cada tipo de solución:

  • Para el análisis de gastos, los resultados se clasifican en Campos de resumen, que incluyen campos como el total de un recibo, y Campos de partidas, que incluyen campos como los elementos individuales de un recibo. Los campos identificados aparecen resaltados en la imagen del documento en el resultado.

  • Para el análisis de los documentos de identidad, la salida muestra los campos que identificó el Ready-to-use modelo, como el nombre y apellidos, la dirección o la fecha de nacimiento. Los campos identificados aparecen resaltados en la imagen del documento en el resultado.

  • Para el análisis de documentos, los resultados se clasifican en texto sin formato, formularios, tablas y firmas. El texto sin formato incluye todo el texto extraído, mientras que los formularios, las tablas y las firmas solo incluyen la información del formulario que pertenezca a esas categorías. Por ejemplo, las tablas solo incluyen la información extraída de las tablas del documento. Los campos identificados aparecen resaltados en la imagen del documento en el resultado.

Tras obtener una vista previa de los resultados, puede seleccionar Descargar la predicción y descargar los resultados como un archivo ZIP.