Dokumentenverarbeitung - Amazon Comprehend

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Dokumentenverarbeitung

Amazon Comprehend unterstützt die einstufige Dokumentenverarbeitung für die benutzerdefinierte Klassifizierung und die Erkennung benutzerdefinierter Entitäten. Sie können beispielsweise eine Mischung aus Klartextdokumenten und halbstrukturierten Dokumenten (wie PDF-Dokumenten, Microsoft Word-Dokumenten und Bildern) in einen benutzerdefinierten Analyseauftrag eingeben.

Bei Eingabedateien, die eine Textextraktion erfordern, führt Amazon Comprehend die Textextraktion automatisch durch, bevor die Analyse ausgeführt wird. Um den Textinhalt zu extrahieren, verwendet Amazon Comprehend einen internen Parser für native halbstrukturierte Dokumente und verwendet Amazon Textract APIs für Bilder und gescannte Dokumente.

Die Amazon Comprehend-Dokumentverarbeitung ist in jeder der Amazon Comprehend verfügbarUnterstützte Regionen, außer Asien-Pazifik (Tokio) und AWS GovCloud (USA-West) unterstützt nur Klartextmodelle für die benutzerdefinierte Klassifizierung.

Die folgenden Themen enthalten Details zu den Eingabedokumenttypen, die Amazon Comprehend für benutzerdefinierte Analysen unterstützt.