Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Testen Sie die Trainingsdaten
Nach dem Training des Modells testet Amazon Comprehend das benutzerdefinierte Klassifikatormodell. Wenn Sie keinen Testdatensatz bereitstellen, trainiert Amazon Comprehend das Modell mit 90 Prozent der Trainingsdaten. Es reserviert 10 Prozent der Trainingsdaten für Tests. Wenn Sie einen Testdatensatz bereitstellen, müssen die Testdaten mindestens ein Beispiel für jedes eindeutige Label im Trainingsdatensatz enthalten.
Durch das Testen des Modells erhalten Sie Metriken, anhand derer Sie die Genauigkeit des Modells abschätzen können. Die Konsole zeigt die Metriken im Abschnitt Classifier-Performance der Classifier-Detailseite in der Konsole an. Sie werden auch in den Metrics
Feldern zurückgegeben, die durch den DescribeDocumentClassifierVorgang zurückgegeben wurden.
Im folgenden Beispiel für Trainingsdaten gibt es fünf Bezeichnungen,DOCUMENTARY,DOCUMENTARY, SCIENCE _FICTION,DOCUMENTARY, ROMANTIC _COMEDY. Es gibt drei eindeutige Klassen:DOCUMENTARY, SCIENCE _FICTION, ROMANTIC _COMEDY.
Spalte 1 | Spalte 2 |
---|---|
DOCUMENTARY | Text des Dokuments 1 |
DOCUMENTARY | Text des Dokuments 2 |
SCIENCE_FICTION | Text des Dokuments 3 |
DOCUMENTARY | Text des Dokuments 4 |
ROMANTIC_COMEDY | Dokument Text 5 |
Bei der auto Aufteilung (bei der Amazon Comprehend 10 Prozent der Trainingsdaten für Tests reserviert) kann der Testdatensatz keine Beispiele für dieses Label enthalten, wenn die Trainingsdaten begrenzte Beispiele für ein bestimmtes Label enthalten. Wenn der Trainingsdatensatz beispielsweise 1000 Instanzen der DOCUMENTARY Klasse, 900 Instanzen von SCIENCE _ FICTION und eine einzelne Instanz der COMEDY Klasse ROMANTIC _ enthält, kann der Testdatensatz 100 DOCUMENTARY und 90 SCIENCE _ FICTION Instanzen enthalten, aber keine ROMANTIC _ COMEDY Instanzen, da nur ein einziges Beispiel verfügbar ist.
Nachdem Sie das Training Ihres Modells abgeschlossen haben, liefern die Trainingsmetriken Informationen, anhand derer Sie entscheiden können, ob das Modell für Ihre Anforderungen ausreichend genau ist.