Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Bewährte Methoden für Images
Wenn Sie Bilddateien für die benutzerdefinierte Klassifizierung oder die Erkennung benutzerdefinierter Entitäten verwenden, verwenden Sie die folgenden Richtlinien, um die besten Ergebnisse zu erzielen:
-
Stellen Sie ein qualitativ hochwertiges Image bereit, idealerweise mindestens 150 DPI.
-
Wenn die Bilddatei eines der unterstützten Formate (TIFF, JPEG oder PNG) verwendet, konvertieren oder reduzieren Sie die Datei nicht, bevor Sie sie in Amazon S3 hochladen.
Um beim Extrahieren von Text aus Tabellen in Dokumenten die besten Ergebnisse zu erzielen, folgen Sie diesen Methoden:
-
Tabellen in Ihrem Dokument sind visuell von umgebenden Elementen auf der Seite getrennt. Beispielsweise wird die Tabelle nicht auf einem Bild oder komplexen Muster überlagert.
-
Der Text in der Tabelle ist fein. Beispielsweise wird der Text nicht relativ zu anderem Text auf der Seite gedreht.
Beim Extrahieren von Text aus Tabellen können in den folgenden Fällen inkonsistente Ergebnisse angezeigt werden:
-
Zusammengeführte Tabellenzellen umfassen mehrere Spalten.
-
Tabellen haben Zellen, Zeilen oder Spalten, die sich von anderen Teilen derselben Tabelle unterscheiden.