Analysephase - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Analysephase

Durch die Verarbeitung von PDF-Dateien extrahieren Sie Inhalte, die für die weitere Verarbeitung und Analyse verwendet werden können. Sie können beispielsweise Kostentrends anhand der Kostenfelder der täglichen Betriebsberichte ermitteln oder Erkenntnisse gewinnen, indem Sie die wichtigsten Leistungsindikatoren (KPIs) für den Geschäftsbetrieb aggregieren. Sie können extrahierte Inhalte auch mit anderen Datenquellen kombinieren, darunter Data Lakes, Data Warehouses, Daten von Drittanbietern oder CRM-Daten (Customer Relationship Management), um eingehende Geschäftsanalysen durchzuführen.

Amazon QuickSight ist ein serverloser Business Intelligence-Dienst, der eine Verbindung zum Amazon Simple Storage Service (Amazon S3) -Bucket herstellt, der Ihre extrahierten PDF-Dateidaten enthält. Ihre Geschäftsanalysten können dann ein Dashboard erstellen, um die JSON-Dateien im S3-Bucket zu analysieren, zu visualisieren und direkt Erkenntnisse daraus zu generieren. Das Dashboard stellt eine Verbindung zum S3-Bucket her und wird automatisch aktualisiert, sobald neue PDF-Dateien verarbeitet wurden. Sie können das Dashboard auch mit verschiedenen Benutzern teilen und Benutzer können das Dashboard auch abonnieren, um es auf einem Mobilgerät anzuzeigen. Weitere Informationen dazu finden Sie in der QuickSight Amazon-Dokumentation unter Erstellen eines Datensatzes mithilfe von Amazon S3 S3-Dateien.

Die meisten PDF-Dateien enthalten auch Rich-Text-Inhalte in Formularen und Tabellen oder in Freitextabsätzen. Nachdem der Textinhalt extrahiert wurde, kann der Rich-Text-Inhalt von anderen Diensten für AWS künstliche Intelligenz und maschinelles Lernen (KI/ML) verwendet werden, die die Verarbeitung natürlicher Sprache (NLP) verarbeiten können, wie Amazon Comprehend oder Amazon Translate. Sie können Amazon Kendra auch zum Indizieren und Durchsuchen von Dokumenten verwenden, die aus einer großen Datenbank mit PDF-Dateien extrahiert wurden.

Ihre Datenwissenschaftler und ML-Techniker können Amazon SageMaker AI auch verwenden, um direkt auf die extrahierten Daten im S3-Bucket oder in der Amazon DynamoDB-Tabelle zuzugreifen und dann erweiterte ML-Modellierung und -Vorhersage zu implementieren.

Bewährte Methoden für die Analysephase

Sie können die folgenden zwei bewährten Methoden verwenden, um eine erfolgreiche Analysephase sicherzustellen: