Aufskalierungsphase - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Aufskalierungsphase

Durch die Verarbeitung von PDF-Dateien extrahieren Sie Inhalte, die für die weitere Verarbeitung und Analyse verwendet werden können. Sie können beispielsweise Kostentrends anhand der Kostenfelder der täglichen Betriebsberichte identifizieren oder Erkenntnisse gewinnen, indem Sie wichtige Leistungsindikatoren (KPIs) für den Geschäftsbetrieb aggregieren. Sie können extrahierte Inhalte auch mit anderen Datenquellen kombinieren, darunter Data Lakes, Data Warehouses, Daten von Drittanbietern oder CRM-Daten (Customer Relationship Management), um eingehende Geschäftsanalysen durchzuführen.

Amazon QuickSight ist ein serverloser Business Intelligence Service, der eine Verbindung zum Amazon Simple Storage Service (Amazon S3) -Bucket herstellt, der Ihre extrahierten PDF-Dateidaten enthält. Ihre Geschäftsanalysten können dann ein Dashboard erstellen, um die JSON-Dateien im S3-Bucket zu analysieren, zu visualisieren und direkt Erkenntnisse daraus zu generieren. Das Dashboard stellt eine Verbindung zum S3-Bucket her und wird automatisch aktualisiert, nachdem neue PDF-Dateien verarbeitet wurden. Sie können das Dashboard auch für verschiedene Benutzer freigeben und Benutzer können das Dashboard auch abonnieren, um es auf einem Mobilgerät anzusehen. Weitere Informationen dazu finden Sie unter Erstellen eines Datensatzes mit Amazon S3 S3-Dateien in der QuickSight Amazon-Dokumentation.

Die meisten PDF-Dateien enthalten auch Rich-Text-Inhalte in Formularen und Tabellen oder in einem Freitextabsatz. Nachdem der Textinhalt extrahiert wurde, kann der Rich-Text-Inhalt von anderen Diensten fürAWS künstliche Intelligenz und maschinelles Lernen (KI/ML) verwendet werden, die die Verarbeitung natürlicher Sprache (NLP) verarbeiten können, wie Amazon Comprehend oder Amazon Translate. Sie können Amazon Kendra auch zum Indizieren und Suchen von Dokumenten verwenden, die aus einer großen Datenbank von PDF-Dateien extrahiert wurden.

Ihre Datenwissenschaftler und ML-Ingenieure können Amazon auch verwenden, SageMaker um direkt auf die extrahierten Daten im S3-Bucket oder in der Amazon DynamoDB-Tabelle zuzugreifen und dann erweiterte ML-Modellierung und -Vorhersage zu implementieren.

Bewährte Methoden für die Analyse-Phase

Sie können die folgenden zwei Best Practices verwenden, um eine erfolgreiche Analysephase sicherzustellen: