Bonnes pratiques pour la phase d'analyse

Phase d'analyse

En traitant des fichiers PDF, vous extrayez du contenu qui peut être utilisé pour un traitement et une analyse ultérieurs. Par exemple, vous pouvez identifier les tendances en matière de coûts en utilisant les champs de coûts des rapports d'opérations quotidiens ou générer des informations en agrégeant les indicateurs de performance clés (KPIs) pour les opérations commerciales. Vous pouvez également combiner le contenu extrait avec d'autres sources de données, notamment des lacs de données, des entrepôts de données, des données tierces ou des données de gestion de la relation client (CRM) pour effectuer des analyses commerciales approfondies.

Amazon QuickSight est un service de business intelligence sans serveur qui se connecte au bucket Amazon Simple Storage Service (Amazon S3) qui contient les données de votre fichier PDF extrait. Vos analystes commerciaux peuvent ensuite créer un tableau de bord pour analyser, visualiser et générer directement des informations à partir des fichiers JSON du compartiment S3. Le tableau de bord se connecte au compartiment S3 et est automatiquement mis à jour après le traitement de nouveaux fichiers PDF. Vous pouvez également partager le tableau de bord avec différents utilisateurs et les utilisateurs peuvent également s'abonner au tableau de bord pour le consulter sur un appareil mobile. Pour plus d'informations à ce sujet, consultez la section Création d'un ensemble de données à l'aide de fichiers Amazon S3 dans la QuickSight documentation Amazon.

La plupart des fichiers PDF contiennent également du texte enrichi dans des formulaires et des tableaux ou dans un paragraphe de texte libre. Une fois le contenu textuel extrait, le contenu en texte enrichi peut être utilisé par d'autres services d'intelligence AWS artificielle et d'apprentissage automatique (AI/ML) capables de gérer le traitement du langage naturel (NLP), tels qu'Amazon Comprehend ou Amazon Translate. Vous pouvez également utiliser Amazon Kendra pour indexer et rechercher des documents extraits d'une vaste base de données de fichiers PDF.

Vos spécialistes des données et vos ingénieurs de machine learning peuvent également utiliser Amazon SageMaker AI pour accéder directement aux données extraites dans le compartiment S3 ou la table Amazon DynamoDB, puis implémenter une modélisation et une prédiction avancées en ML.

Bonnes pratiques pour la phase d'analyse

Vous pouvez utiliser les deux meilleures pratiques suivantes pour garantir le succès de la phase d'analyse :

Créez un fichier manifeste pour utiliser un compartiment S3 comme source de données pour QuickSight. Pour plus d'informations à ce sujet, consultez la section Créer une analyse à l'aide de vos propres données Amazon S3 dans la QuickSight documentation.
Mettez automatiquement à jour votre ensemble de données pour capturer toutes les nouvelles données ajoutées à Amazon S3 et actualisez votre tableau de bord. Pour plus d'informations à ce sujet, consultez la section Actualisation planifiée d'un ensemble de données dans la QuickSight documentation.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Phase de stockage des données

FAQ