Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Vorbereiten Ihrer Datensätze
Um einen Adapter zu erstellen, müssen Sie Rekognition zwei Datensätze zur Verfügung stellen, einen Trainingsdatensatz und einen Testdatensatz. Jeder Datensatz besteht aus zwei Elementen: Bildern und Anmerkungen/Labels. In den folgenden Abschnitten wird erklärt, wofür Labels und Bilder verwendet werden und wie sie zusammengefügt werden, um Datensätze zu erstellen.
Bilder
Sie müssen einen Adapter anhand repräsentativer Stichproben Ihrer Bilder trainieren. Wenn Sie Bilder für das Training auswählen, versuchen Sie, mindestens einige Bilder einzufügen, die die erwartete Reaktion für jedes der Labels zeigen, auf die Sie mit Ihrem Adapter abzielen.
Um einen Trainingsdatensatz zu erstellen, müssen Sie einen der folgenden beiden Bildtypen angeben:
-
Bilder mit falsch positiven Vorhersagen. Zum Beispiel, wenn ein Basismodell voraussagt, dass in einem Bild Alkohol enthalten ist, dies aber nicht der Fall ist.
-
Bilder mit falsch negativen Vorhersagen. Zum Beispiel, wenn ein Basismodell voraussagt, dass in einem Bild kein Alkohol enthalten ist, der Alkohol aber vorhanden ist.
Um einen ausgewogenen Datensatz zu erstellen, wird empfohlen, einen der beiden folgenden Bildtypen bereitzustellen:
-
Bilder mit wahren positiven Vorhersagen. Zum Beispiel, wenn ein Basismodell korrekt vorhersagt, dass ein Bild Alkohol enthält. Es wird empfohlen, diese Bilder bereitzustellen, wenn Sie falsch positive Bilder angeben.
-
Bilder mit wahren negativen Vorhersagen. Zum Beispiel, wenn ein Basismodell korrekt voraussagt, dass ein Bild keinen Alkohol enthält. Es wird empfohlen, diese Bilder bereitzustellen, wenn Sie falsch negative Bilder bereitstellen.
Labels
Ein Label bezieht sich auf Folgendes: Objekte, Ereignisse, Konzepte oder Aktivitäten. Bei der Inhaltsmoderation ist ein Label ein Beispiel für Inhalte, die unangemessen, unerwünscht oder anstößig sind.
Im Zusammenhang mit der Erstellung eines Adapters durch Training des Basismodells von Rekognition wird ein Label, das einem Bild zugewiesen wird, als Anmerkung bezeichnet. Wenn Sie einen Adapter mit der Rekognition-Konsole trainieren, verwenden Sie die Konsole, um Anmerkungen zu Ihren Bildern hinzuzufügen, indem Sie ein Label auswählen und dann die Bilder markieren, die dem Label entsprechen. Durch diesen Prozess lernt das Modell, Elemente Ihrer Bilder anhand des zugewiesenen Labels zu identifizieren. Durch diesen Verknüpfungsprozess kann sich das Modell bei der Erstellung eines Adapters auf die relevantesten Inhalte konzentrieren, was zu einer verbesserten Genauigkeit bei der Bildanalyse führt.
Alternativ können Sie eine Manifestdatei bereitstellen, die Informationen zu Bildern und den dazugehörigen Anmerkungen enthält.
Trainieren und Testen von Datensätzen
Der Trainingsdatensatz ist die Grundlage für die Feinabstimmung des Modells und die Erstellung eines benutzerdefinierten Adapters. Sie müssen einen kommentierten Trainingsdatensatz bereitstellen, aus dem das Modell lernen kann. Das Modell lernt aus diesem Datensatz, um seine Leistung bei der Art der von Ihnen bereitgestellten Bilder zu verbessern.
Um die Genauigkeit zu verbessern, müssen Sie Ihren Trainingsdatensatz anhand von annotation/labeling Bildern erstellen. Sie können dies auf zwei Arten erreichen:
Manuelle Labelzuweisung: Sie können die Rekognition-Konsole verwenden, um einen Trainingsdatensatz zu erstellen, indem Sie die Bilder hochladen, die Ihr Datensatz enthalten soll, und diesen Bildern dann manuell Labels zuweisen.
Manifestdatei: Sie können eine Manifestdatei verwenden, um Ihren Adapter zu trainieren. Die Manifestdatei enthält Informationen zu den Grundwahrheitsanmerkungen für Ihre Trainings- und Testbilder sowie den Speicherort Ihrer Trainingsbilder. Sie können die Manifestdatei bereitstellen, wenn Sie einen Adapter mit der Rekognition trainieren APIs oder wenn Sie die AWS Konsole verwenden.
Der Testdatensatz wird verwendet, um die Leistung des Adapters nach dem Training zu bewerten. Um eine zuverlässige Auswertung zu gewährleisten, wird der Testdatensatz unter Verwendung eines Abschnitts des ursprünglichen Trainingsdatensatzes erstellt, den das Modell noch nicht gesehen hat. Dieser Prozess stellt sicher, dass die Leistung des Adapters anhand neuer Daten bewertet wird, wodurch genaue Messungen und Metriken erstellt werden. Optimale Genauigkeitsverbesserungen finden Sie unter Bewährte Methoden für Trainingsadapter.