Bewährte Methoden für Bilder

Wenn Sie Bilddateien für die benutzerdefinierte Klassifizierung oder benutzerdefinierte Objekterkennung verwenden, sollten Sie sich an die folgenden Richtlinien halten, um optimale Ergebnisse zu erzielen:

Stellen Sie ein qualitativ hochwertiges Bild bereit, idealerweise mindestens 150 DPI.
Wenn die Bilddatei eines der unterstützten Formate (TIFF, JPEG oder PNG) verwendet, konvertieren oder verkleinern Sie die Datei nicht, bevor Sie sie auf Amazon S3 hochladen.

Um die besten Ergebnisse beim Extrahieren von Text aus Tabellen in Dokumenten zu erzielen, gehen Sie wie folgt vor:

Die Tabellen in Ihrem Dokument sind visuell von den umgebenden Elementen auf der Seite getrennt. Die Tabelle wird beispielsweise nicht über ein Bild oder ein komplexes Muster gelegt.
Der Text in der Tabelle ist aufrecht. Beispielsweise ist der Text nicht relativ zu anderem Text auf der Seite gedreht.

Beim Extrahieren von Text aus Tabellen kann es in den folgenden Fällen zu inkonsistenten Ergebnissen kommen:

Zusammengeführte Tabellenzellen erstrecken sich über mehrere Spalten.
Tabellen haben Zellen, Zeilen oder Spalten, die sich von anderen Teilen derselben Tabelle unterscheiden.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Optionen für die Textextraktion festlegen

Benutzerdefinierte Klassifizierung