Phase d'analyse - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Phase d'analyse

En traitant des fichiers PDF, vous extrayez du contenu qui peut être utilisé pour un traitement et une analyse ultérieurs. Par exemple, vous pouvez identifier les tendances des coûts en utilisant les champs de coûts des rapports d'exploitation quotidiens ou générer des informations en agrégeant les indicateurs de performance clés (KPI) pour les opérations commerciales. Vous pouvez également combiner le contenu extrait avec d'autres sources de données, notamment des lacs de données, des entrepôts de données, des données tierces ou des données de gestion de la relation client (CRM) pour effectuer des analyses commerciales approfondies.

Amazon QuickSight est un service de business intelligence sans serveur qui se connecte au compartiment Amazon Simple Storage Service (Amazon S3) contenant les données de vos fichiers PDF extraits. Vos analystes commerciaux peuvent ensuite créer un tableau de bord pour analyser, visualiser et générer directement des informations à partir des fichiers JSON contenus dans le compartiment S3. Le tableau de bord se connecte au compartiment S3 et se met automatiquement à jour après le traitement de nouveaux fichiers PDF. Vous pouvez également partager le tableau de bord avec différents utilisateurs et les utilisateurs peuvent également s'abonner au tableau de bord pour le consulter sur un appareil mobile. Pour plus d'informations à ce sujet, consultez la section Création d'un jeu de données à l'aide de fichiers Amazon S3 dans la QuickSight documentation Amazon.

La plupart des fichiers PDF contiennent également du contenu en texte enrichi dans des formulaires et des tableaux ou dans un paragraphe de texte libre. Une fois le contenu textuel extrait, le contenu textuel enrichi peut être utilisé par d'autres services d'intelligenceAWS artificielle et d'apprentissage automatique (AI/ML) capables de gérer le traitement du langage naturel (NLP), tels qu'Amazon Comprehend ou Amazon Translate. Vous pouvez également utiliser Amazon Kendra pour indexer et rechercher des documents extraits d'une grande base de données de fichiers PDF.

Vos data scientists et vos ingénieurs ML peuvent également utiliser Amazon SageMaker pour accéder directement aux données extraites dans le compartiment S3 ou dans la table Amazon DynamoDB, puis implémenter une modélisation et une prédiction avancées en matière d'apprentissage automatique.

Bonnes pratiques relatives à la phase d'analyse

Vous pouvez utiliser les deux meilleures pratiques suivantes pour garantir le succès de la phase d'analyse :

  • Créez un fichier manifeste afin d'utiliser un compartiment S3 comme source de données pour Amazon QuickSight. Pour plus d'informations à ce sujet, consultez la section Créer une analyse à l'aide de vos propres données Amazon S3 dans la QuickSight documentation Amazon.

  • Mettez automatiquement à jour votre ensemble de données pour capturer toutes les nouvelles données ajoutées à Amazon S3 et actualiser votre tableau de bord. Pour plus d'informations à ce sujet, consultez Actualiser un jeu de données selon un calendrier dans la QuickSight documentation Amazon.