Analysephase

Durch die Verarbeitung von PDF-Dateien extrahieren Sie Inhalte, die für die weitere Verarbeitung und Analyse verwendet werden können. Sie können beispielsweise Kostentrends anhand der Kostenfelder der täglichen Betriebsberichte ermitteln oder Erkenntnisse gewinnen, indem Sie die wichtigsten Leistungsindikatoren (KPIs) für den Geschäftsbetrieb aggregieren. Sie können extrahierte Inhalte auch mit anderen Datenquellen kombinieren, darunter Data Lakes, Data Warehouses, Daten von Drittanbietern oder CRM-Daten (Customer Relationship Management), um eingehende Geschäftsanalysen durchzuführen.

Amazon QuickSight ist ein serverloser Business Intelligence-Dienst, der eine Verbindung zum Amazon Simple Storage Service (Amazon S3) -Bucket herstellt, der Ihre extrahierten PDF-Dateidaten enthält. Ihre Geschäftsanalysten können dann ein Dashboard erstellen, um die JSON-Dateien im S3-Bucket zu analysieren, zu visualisieren und direkt Erkenntnisse daraus zu generieren. Das Dashboard stellt eine Verbindung zum S3-Bucket her und wird automatisch aktualisiert, sobald neue PDF-Dateien verarbeitet wurden. Sie können das Dashboard auch mit verschiedenen Benutzern teilen und Benutzer können das Dashboard auch abonnieren, um es auf einem Mobilgerät anzuzeigen. Weitere Informationen dazu finden Sie in der QuickSight Amazon-Dokumentation unter Erstellen eines Datensatzes mithilfe von Amazon S3 S3-Dateien.

Die meisten PDF-Dateien enthalten auch Rich-Text-Inhalte in Formularen und Tabellen oder in Freitextabsätzen. Nachdem der Textinhalt extrahiert wurde, kann der Rich-Text-Inhalt von anderen Diensten für AWS künstliche Intelligenz und maschinelles Lernen (KI/ML) verwendet werden, die die Verarbeitung natürlicher Sprache (NLP) verarbeiten können, wie Amazon Comprehend oder Amazon Translate. Sie können Amazon Kendra auch zum Indizieren und Durchsuchen von Dokumenten verwenden, die aus einer großen Datenbank mit PDF-Dateien extrahiert wurden.

Ihre Datenwissenschaftler und ML-Techniker können Amazon SageMaker AI auch verwenden, um direkt auf die extrahierten Daten im S3-Bucket oder in der Amazon DynamoDB-Tabelle zuzugreifen und dann erweiterte ML-Modellierung und -Vorhersage zu implementieren.

Bewährte Methoden für die Analysephase

Sie können die folgenden zwei bewährten Methoden verwenden, um eine erfolgreiche Analysephase sicherzustellen:

Erstellen Sie eine Manifestdatei, für die Sie einen S3-Bucket als Datenquelle verwenden möchten QuickSight. Weitere Informationen dazu finden Sie in der QuickSight Dokumentation unter Erstellen einer Analyse mit Ihren eigenen Amazon S3 S3-Daten.
Aktualisieren Sie Ihren Datensatz automatisch, um alle neu zu Amazon S3 hinzugefügten Daten zu erfassen und Ihr Dashboard zu aktualisieren. Weitere Informationen dazu finden Sie in der QuickSight Dokumentation unter Einen Datensatz nach einem Zeitplan aktualisieren.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Phase der Datenspeicherung

Häufig gestellte Fragen