Fase de análisis - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Fase de análisis

Al procesar PDF los archivos, se extrae contenido que se puede utilizar para su posterior procesamiento y análisis. Por ejemplo, puede identificar las tendencias de los costes utilizando los campos de costes de los informes de operaciones diarios o generar información mediante la agregación de los indicadores clave de rendimiento (KPIs) de las operaciones empresariales. También puede combinar el contenido extraído con otras fuentes de datos, como lagos de datos, almacenes de datos, datos de terceros o datos de gestión de relaciones con los clientes (CRM) para realizar análisis empresariales exhaustivos.

Amazon QuickSight es un servicio de inteligencia empresarial sin servidor que se conecta al depósito de Amazon Simple Storage Service (Amazon S3) que contiene los datos de los archivos PDF extraídos. Luego, sus analistas de negocios pueden crear un panel para analizar, visualizar y generar información directamente a partir de los JSON archivos del depósito de S3. El panel se conecta al bucket de S3 y se actualiza automáticamente una vez que se procesan PDF los archivos nuevos. También puede compartir el panel con diferentes usuarios y los usuarios también pueden suscribirse al panel para verlo en un dispositivo móvil. Para obtener más información al respecto, consulte Creación de un conjunto de datos con archivos de Amazon S3 en la QuickSight documentación de Amazon.

La mayoría de PDF los archivos también contienen contenido de texto enriquecido dentro de formularios y tablas o en un párrafo de texto libre. Una vez extraído el contenido del texto, otros servicios de inteligencia AWS artificial y aprendizaje automático (AI/ML) que pueden procesar el lenguaje natural () pueden utilizar el contenido de texto enriquecido (NLP), como Amazon Comprehend o Amazon Translate. También puede usar Amazon Kendra para indexar y buscar documentos extraídos de una gran base de datos de archivos. PDF

Sus científicos de datos e ingenieros de aprendizaje automático también pueden utilizar Amazon SageMaker AI para acceder directamente a los datos extraídos en el bucket de S3 o en la tabla de Amazon DynamoDB y, a continuación, implementar modelos y predicciones de aprendizaje automático avanzados.

Prácticas recomendadas para la fase de análisis

Puede utilizar las dos mejores prácticas siguientes para garantizar el éxito de la fase de análisis:

  • Crea un archivo de manifiesto para usar un bucket de S3 como fuente de datos para Amazon QuickSight. Para obtener más información al respecto, consulte Crear un análisis con sus propios datos de Amazon S3 en la QuickSight documentación de Amazon.

  • Actualice automáticamente su conjunto de datos para capturar cualquier dato nuevo que se añada a Amazon S3 y actualice su panel de control. Para obtener más información al respecto, consulta Actualizar un conjunto de datos de forma programada en la QuickSight documentación de Amazon.