Modellanpassung: Unteranpassung vs. Overfitting - Amazon Machine Learning

Wir aktualisieren den Amazon Machine Learning Learning-Service nicht mehr und akzeptieren keine neuen Benutzer mehr dafür. Diese Dokumentation ist für bestehende Benutzer verfügbar, wir aktualisieren sie jedoch nicht mehr. Weitere Informationen finden Sie unterWas Amazon Machine Learning.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Modellanpassung: Unteranpassung vs. Overfitting

Wenn Sie die Modellanpassung verstehen, verstehen Sie auch die Ursache für eine schlechte Modellrichtigkeit. Auf der Grundlage dieses Verständnisses könne Sie korrigierende Maßnahmen ergreifen. Wir können bestimmen, ob ein Voraussagemodell die Schulungsdaten zu viel oder zu wenig anpasst, indem wir uns den Voraussagefehler für die Schulungsdaten und Evaluationsdaten ansehen.

Ihr Modell ist führt eine Unteranpassung der Schulungsdaten durch, wenn das Modell die Schulungsdaten nicht gut verarbeitet. Der Grund hierfür ist, dass das Modell die Beziehung zwischen den Eingabebeispielen (häufig als "X" bezeichnet) und den Zielwerten (häufig als "Y" bezeichnet) nicht erfassen kann. Ihr Modell führt eine Überanpassung Ihrer Schulungsdaten durch, wenn die Leistung des ML-Modells an den Lerndaten selbst gut ist, es jedoch an der Datenauswertung scheitert. Der Grund hierfür ist, dass das Modell sich die bekannten Daten merkt und diese nicht auf unbekannte Beispiele anwenden kann.

Eine schlechte Leistung an den Lerndaten kann daran liegen, dass das Modell zu einfach ist (die Eingabefunktionen sind nicht ausdrucksstark genug), um das Ziel gut zu beschreiben. Die Leistung kann verbessert werden, indem die Flexibilität des Modells erhöht wird. Um die Flexibilität des Modells zu erhöhen, führen Sie die folgenden Schritte aus:

  • Fügen Sie neue Domain-spezifische Funktionen und mehr kartesischen Produkte hinzu, und ändern Sie die Art der verwendeten Funktionsverarbeitung (z. B. Erhöhen der n-grams-Größe)

  • Verringern Sie den Umfang der verwendeten Regularisation

Wenn Ihr Modell die Schulungsdaten übermäßig stark anpasst, ist es durchaus sinnvoll, entsprechende Maßnahmen zu ergreifen, um die Flexibilität des Modells zu reduzieren. Um die Flexibilität des Modells zu reduzieren, führen Sie die folgenden Schritte aus:

  • Funktionsauswahl: Verwenden Sie weniger Funktionskombinationen, reduzieren Sie die n-grams-Größe, und reduzieren Sie die Anzahl der Bins für numerische Attribute.

  • Erhöhen Sie den Umfang der verwendeten Regularisation.

Die Richtigkeit von Schulungs- und Prüfdaten kann gering sein, da der Lernalgorithmus nicht ausreichend Daten zum lernen zur Verfügung hatte. Sie können die Leistung verbessern, indem Sie die folgenden Schritte ausführen:

  • Erhöhen Sie die Anzahl der Schulungsdatenbeispiele.

  • Erhöhen Sie die Anzahl von Durchläufen durch die vorhandenen Schulungsdaten.