So funktioniert Bildklassifizierung - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So funktioniert Bildklassifizierung

Der Bildklassifikationsalgorithmus nimmt ein Bild als Eingabe und klassifiziert es in eine der Ausgabekategorien. Deep Learning hat die Domain der Bildklassifizierung revolutioniert und großartige Leistungen erzielt. Verschiedene Deep-Learning-Netzwerke wie ResNetDenseNet,, Inception usw. wurden so entwickelt, dass sie bei der Bildklassifizierung sehr genau sind. Gleichzeitig wurden Anstrengungen zur Erfassung gekennzeichneter Bilddaten unternommen, die für das Training dieser Netzwerke von wesentlicher Bedeutung sind. ImageNetist ein so großer Datensatz mit mehr als 11 Millionen Bildern mit etwa 11.000 Kategorien. Sobald ein Netzwerk mit ImageNet Daten trainiert wurde, kann es durch einfache Neuanpassung oder Feinabstimmung auch zur Generalisierung mit anderen Datensätzen verwendet werden. Bei diesem Transfer-Learning-Ansatz wird ein Netzwerk mit Gewichten initialisiert (in diesem Beispiel mit Gewichten trainiert ImageNet), die später für eine Bildklassifizierungsaufgabe in einem anderen Datensatz verfeinert werden können.

Die Bildklassifizierung in Amazon SageMaker kann in zwei Modi ausgeführt werden: Vollständiges Training und Transferlernen. Im vollständigen Trainingsmodus wird das Netzwerk mit zufälligen Gewichtungen initialisiert und mit Benutzerdaten von Grund auf neu trainiert. Im Transferlernmodus wird das Netzwerk mit vortrainierten Gewichtungen initialisiert und nur die oberste vollständig verbundene Schicht wird mit zufälligen Gewichtungen initialisiert. Dann wird das gesamte Netzwerk mit neuen Daten optimiert. In diesem Modus ist auch das Trainieren mit einem kleineren Datenset möglich. Der Grund hierfür ist, dass das Netzwerk bereits trainiert ist und deshalb in Situationen ohne ausreichende Trainingsdaten verwendet werden kann.