Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Fase de análisis.
Al procesar archivos PDF, se extrae contenido que se puede utilizar para su posterior procesamiento y análisis. Por ejemplo, puede identificar las tendencias de los costos utilizando los campos de costos de los informes de operaciones diarias o generar información mediante la agregación de los indicadores clave de desempeño (KPI) para las operaciones comerciales. También puede combinar el contenido extraído con otras fuentes de datos, como lagos de datos, almacenes de datos, datos de terceros o datos de gestión de relaciones con los clientes (CRM) para realizar análisis empresariales exhaustivos.
Amazon QuickSight es un servicio de inteligencia empresarial sin servidor que se conecta al bucket de Amazon Simple Storage Service (Amazon S3) que contiene los datos del archivo PDF extraído. Luego, sus analistas de negocios pueden crear un panel para analizar, visualizar y generar información directamente a partir de los archivos JSON del bucket S3. El panel de control se conecta al bucket de S3 y se actualiza automáticamente una vez que se procesan nuevos archivos PDF. También puedes compartir el panel de control con diferentes usuarios y los usuarios también pueden suscribirse al panel para verlo en un dispositivo móvil. Para obtener más información al respecto, consulte Creación de un conjunto de datos con archivos de Amazon S3 en la QuickSight documentación de Amazon.
La mayoría de los archivos PDF también contienen contenido de texto enriquecido dentro de formularios y tablas o en un párrafo de texto libre. Una vez extraído el contenido del texto, otros servicios de inteligenciaAWS artificial y aprendizaje automático (AI/ML) que pueden gestionar el procesamiento del lenguaje natural (PNL), como Amazon Comprehend o Amazon Translate, pueden utilizar el contenido de texto enriquecido. También puede utilizar Amazon Kendra para indexar y buscar documentos extraídos de una gran base de datos de archivos PDF.
Sus científicos de datos e ingenieros de aprendizaje automático también pueden usar Amazon SageMaker para acceder directamente a los datos extraídos del bucket S3 o de la tabla de Amazon DynamoDB y, a continuación, implementar modelos y predicciones de ML avanzados.
Prácticas recomendadas recomendadas para la fase de análisis de análisis.
Puede utilizar las dos mejores prácticas siguientes para garantizar una fase de análisis exitosa:
-
Cree un archivo de manifiesto para usar un bucket de S3 como origen de datos para Amazon QuickSight. Para obtener más información al respecto, consulte Crear un análisis con sus propios datos de Amazon S3 en la QuickSight documentación de Amazon.
-
Actualice automáticamente su conjunto de datos para capturar cualquier dato nuevo agregado a Amazon S3 y actualice su panel de control. Para obtener más información al respecto, consulte Actualizar un conjunto de datos según un cronograma en la QuickSight documentación de Amazon.