Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Fase di analisi
Elaborando i file PDF, si estrae il contenuto che può essere utilizzato per ulteriori elaborazioni e analisi. Ad esempio, è possibile identificare le tendenze dei costi utilizzando i campi dei costi dei report operativi giornalieri o generare informazioni aggregando gli indicatori chiave di performance (KPI) per le operazioni aziendali. Puoi anche combinare i contenuti estratti con altre fonti di dati, tra cui data lake, data warehouse, dati di terze parti o dati di gestione delle relazioni con i clienti (CRM) per eseguire analisi aziendali approfondite.
Amazon QuickSight è un servizio di business intelligence senza server che si connette al bucket Amazon Simple Storage Service (Amazon S3) che contiene i dati dei file PDF estratti. Gli analisti aziendali possono quindi creare una dashboard per analizzare, visualizzare e generare direttamente informazioni dai file JSON nel bucket S3. La dashboard si collega al bucket S3 e si aggiorna automaticamente dopo l'elaborazione di nuovi file PDF. Puoi anche condividere la dashboard con diversi utenti e gli utenti possono anche iscriversi alla dashboard per visualizzarla su un dispositivo mobile. Per ulteriori informazioni a riguardo, consulta Creazione di un set di dati utilizzando file Amazon S3 nella QuickSight documentazione di Amazon.
La maggior parte dei file PDF contiene anche contenuti di testo RTF all'interno di moduli e tabelle o in un paragrafo a testo libero. Dopo l'estrazione del contenuto di testo, il contenuto di testo ricco può essere utilizzato da altri servizi di intelligenzaAWS artificiale e apprendimento automatico (AI/ML) in grado di gestire l'elaborazione del linguaggio naturale (NLP), come Amazon Comprehend o Amazon Translate. Puoi anche usare Amazon Kendra per indicizzare e cercare documenti estratti da un ampio database di file PDF.
I tuoi data scientist e ingegneri di ML possono anche utilizzare Amazon SageMaker per accedere direttamente ai dati estratti nel bucket S3 o nella tabella Amazon DynamoDB e quindi implementare modelli e previsioni di ML avanzati.
Best practice per la fase di analisi
È possibile utilizzare le due best practice seguenti per garantire una fase di analisi di successo:
-
Crea un file manifest per utilizzare un bucket S3 come origine dati per Amazon QuickSight. Per ulteriori informazioni a riguardo, consulta Creare un'analisi utilizzando i tuoi dati Amazon S3 nella QuickSight documentazione di Amazon.
-
Aggiorna automaticamente il tuo set di dati per acquisire tutti i nuovi dati aggiunti ad Amazon S3 e aggiornare la dashboard. Per ulteriori informazioni a riguardo, consulta Aggiornamento di un set di dati in base a una pianificazione nella QuickSight documentazione di Amazon.