So funktioniert Bildklassifikation - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So funktioniert Bildklassifikation

Der Bildklassifikationsalgorithmus nimmt ein Bild als Eingabe und klassifiziert es in eine der Ausgabekategorien. Deep Learning hat die Domäne der Bildklassifikation revolutioniert und großartige Leistungen erzielt. Verschiedene Deep-Learning-Netzwerke wie ResNet, DenseNet, Inception, usw. wurden entwickelt, um eine hohe Genauigkeit bei der Bildklassifizierung zu erzielen. Gleichzeitig wurden Anstrengungen zur Erfassung gekennzeichneter Bilddaten unternommen, die für das Training dieser Netzwerke von wesentlicher Bedeutung sind. ImageNet ist ein solcher großer Datensatz, der mehr als 11 Millionen Bilder mit etwa 11.000 Kategorien enthält. Sobald ein Netzwerk mit ImageNet-Daten trainiert ist, kann es durch einfache Neuanpassung oder Optimierung für die Generalisierung mit anderen Datasets verwendet werden. In diesem Transferlernansatz wird ein Netzwerk mit Gewichtungen initialisiert (in diesem Beispiel mit ImageNet trainiert), was zu einem späteren Zeitpunkt für eine Bildklassifikationsaufgabe in einem anderen Dataset optimiert werden kann.

Die Bildklassifikation in Amazon SageMaker kann in zwei Modi ausgeführt werden: vollständiges Training und Transfer-Lernen. Im vollständigen Trainingsmodus wird das Netzwerk mit zufälligen Gewichtungen initialisiert und mit Benutzerdaten von Grund auf neu trainiert. Im Transferlernmodus wird das Netzwerk mit vortrainierten Gewichtungen initialisiert und nur die oberste vollständig verbundene Schicht wird mit zufälligen Gewichtungen initialisiert. Dann wird das gesamte Netzwerk mit neuen Daten optimiert. In diesem Modus ist auch das Trainieren mit einem kleineren Datenset möglich. Der Grund hierfür ist, dass das Netzwerk bereits trainiert ist und deshalb in Situationen ohne ausreichende Trainingsdaten verwendet werden kann.