So funktioniert die Objekterkennung - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So funktioniert die Objekterkennung

Der Objekterkennungsalgorithmus identifiziert und sucht alle Instances von Objekten in einem Bild aus einer bekannten Sammlung von Objektkategorien. Der Algorithmus akzeptiert ein Bild als Eingabe und gibt die Kategorie, der das Objekt angehört, zusammen mit einem Zuverlässigkeitswert aus, der zeigt, dass es der Kategorie angehört. Der Algorithmus prognositiziert außerdem den Speicherort und die Größe des Objekts mit einem rechteckigen Begrenzungsrahmen. Die Amazon SageMaker-Objekterkennung verwendet den Single Shot Multibox Detection (SSD)-Algorithmus, der ein für die Klassifizierungsaufgabe vorgeschultes Convolutional Neural Network (CNN) als Basisnetzwerk verwendet. SSD verwendet die Ausgabe von intermediären Ebenen als Funktionen zur Erkennung.

Verschiedene CNNs wie z. B. VGG und ResNet haben eine hohe Leistung in der Bildklassifizierungsaufgabe erreicht. Die Objekterkennung in Amazon SageMaker unterstützt sowohl VGG-16 als auch ResNet-50 als Basisnetzwerk für SSD. Der Algorithmus kann im vollständigen Schulungsmodus oder im Transferlern-Modus geschult werden. Im vollständigen Schulungsmodus wird das Basisnetzwerk mit zufälligen Gewichtungen initialisiert und anschließend mit Benutzerdaten geschult. Im Transferlernmodus werden die Gewichtungen des Basisnetzwerks aus den vorgeschulten Modellen geladen.

Der Objekterkennungsalgorithmus verwendet während des Betriebs intern Standard-Operationen zur Datenaugmentierung, wie z. B. Flip, Rescale und Jitter, um Overfitting-Probleme zu vermeiden.