Erstellen Sie Ihren Datensatz - Amazon Lookout für Vision

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen Sie Ihren Datensatz

Ein Datensatz enthält die Bilder und zugewiesenen Beschriftungen, die Sie zum Trainieren und Testen eines Modells verwenden. Sie erstellen den Datensatz für Ihr Projekt mit der Amazon Lookout for Vision Vision-Konsole oder mit der CreateDatasetOperation. Die Datensatz-Bilder müssen entsprechend dem Modelltyp, den Sie erstellen möchten, beschriftet werden (Bildklassifizierung oder Bildsegmentierung).

Bilder für einen Datensatz vorbereiten

Sie benötigen eine Sammlung von Bildern, um einen Datensatz zu erstellen. Ihre Bilder müssen Dateien JPEG im Format PNG Or sein. Die Anzahl und Art der Bilder, die Sie benötigen, hängt davon ab, ob Ihr Projekt einen einzelnen Datensatz oder separate Trainings- und Testdatensätze enthält.

Projekt mit einem einzigen Datensatz

Um ein Modell zur Bildklassifizierung zu erstellen, benötigen Sie Folgendes, um mit dem Training zu beginnen:

  • Mindestens 20 Bilder von normalen Objekten.

  • Mindestens 10 Bilder von anomalen Objekten.

Um ein Bildsegmentierungsmodell zu erstellen, benötigen Sie Folgendes, um mit dem Training zu beginnen:

  • Mindestens 20 Bilder von jedem Anomalie-Typ.

  • Jedes anomale Bild (Bild mit vorhandenen Anomaliearten) darf nur eine Art von Anomalie aufweisen.

  • Mindestens 20 Bilder von normalen Objekten.

Separates Projekt für Trainings- und Testdatensätze

Um ein Modell zur Bildklassifizierung zu erstellen, benötigen Sie Folgendes:

  • Mindestens 10 Bilder von normalen Objekten im Trainingsdatensatz.

  • Mindestens 10 Bilder von normalen Objekten im Testdatensatz.

  • Mindestens 10 Bilder von anomalen Objekten im Testdatensatz.

Um ein Bildsegmentierungsmodell zu erstellen, benötigen Sie Folgendes:

  • Jeder Datensatz benötigt mindestens 10 Bilder jedes Anomalie-Typs.

  • Jedes anomale Bild (Bild mit vorhandenen Anomaliearten) darf nur eine Art von Anomalie enthalten.

  • Jeder Datensatz muss mindestens 10 Bilder von normalen Objekten enthalten.

Verwenden Sie mehr als die Mindestanzahl an Bildern, um ein Modell mit höherer Qualität zu erstellen. Wenn Sie ein Segmentierungsmodell erstellen, empfehlen wir, Bilder mit mehreren Anomalietypen einzubeziehen. Diese zählen jedoch nicht zu dem Minimum, das Lookout for Vision benötigt, um mit dem Training zu beginnen.

Ihre Bilder sollten von einem einzigen Objekttyp sein. Außerdem sollten Sie für die Bildaufnahme einheitliche Bedingungen wie Kamerapositionierung, Beleuchtung und Objektposition einhalten.

Alle Bilder in den Trainings- und Testdatensätzen müssen dieselben Abmessungen haben. Später müssen die Bilder, die Sie mit Ihrem trainierten Modell analysieren, dieselben Abmessungen haben wie die Bilder der Trainings- und Testdatensätze. Weitere Informationen finden Sie unter Erkennung von Anomalien in einem Bild.

Alle Trainings- und Testbilder müssen eindeutige Bilder sein, vorzugsweise von eindeutigen Objekten. Normale Bilder sollten die normalen Variationen des zu analysierenden Objekts erfassen. Bei anomalen Bildern sollte eine Vielzahl von Anomalien erfasst werden.

Amazon Lookout for Vision bietet Beispielbilder, die Sie verwenden können. Weitere Informationen finden Sie unter Datensatz zur Bildklassifizierung.

Informationen zu Bildbeschränkungen finden Sie unterKontingente bei Amazon Lookout for Vision.

Den Datensatz erstellen

Wenn Sie den Datensatz für Ihr Projekt erstellen, wählen Sie die anfängliche Datensatzkonfiguration Ihres Projekts aus. Sie wählen auch aus, woher Lookout for Vision die Bilder importiert.

Wählen Sie eine Datensatzkonfiguration für Ihr Projekt

Wenn Sie den ersten Datensatz in Ihrem Projekt erstellen, wählen Sie eine der folgenden Datensatzkonfigurationen:

  • Einzelner Datensatz — Ein einzelnes Datensatzprojekt verwendet einen einzelnen Datensatz, um Ihr Modell zu trainieren und zu testen. Die Verwendung eines einzigen Datensatzes vereinfacht das Training, da Amazon Lookout for Vision die Trainings- und Testbilder auswählen kann. Während des Trainings teilt Amazon Lookout for Vision den Datensatz intern in einen Trainingsdatensatz und einen Testdatensatz auf. Sie haben keinen Zugriff auf die geteilten Datensätze. Für die meisten Szenarien empfehlen wir, ein einzelnes Datensatzprojekt zu verwenden.

  • Separate Trainings- und Testdatensätze — Wenn Sie eine genauere Kontrolle über Training, Tests und Leistungsoptimierung wünschen, können Sie Ihr Projekt so konfigurieren, dass es separate Trainings- und Testdatensätze enthält. Verwenden Sie einen separaten Testdatensatz, wenn Sie die Kontrolle über die zum Testen verwendeten Bilder haben möchten oder wenn Sie bereits über einen Benchmarksatz von Bildern verfügen, den Sie verwenden möchten.

Sie können einem vorhandenen Einzeldatensatzprojekt einen Testdatensatz hinzufügen. Der einzelne Datensatz wird dann zum Trainingsdatensatz. Wenn Sie den Testdatensatz aus einem Projekt mit separaten Trainings- und Testdatensätzen entfernen, wird das Projekt zu einem einzigen Datensatzprojekt. Weitere Informationen finden Sie unter Löschen eines Datensatzes.

Bilder importieren

Wenn Sie einen Datensatz erstellen, wählen Sie aus, woher die Bilder importiert werden sollen. Je nachdem, wie Sie die Bilder importieren, sind die Bilder möglicherweise bereits beschriftet. Wenn die Bilder nach der Erstellung des Datensatzes nicht beschriftet wurden, finden Sie weitere Informationen unterLabeling von Bildern.

Sie erstellen einen Datensatz und importieren seine Bilder auf eine der folgenden Arten:

  • Importieren Sie Bilder von Ihrem lokalen Computer. Die Bilder sind nicht beschriftet. Sie fügen Beschriftungen mithilfe der Lookout for Vision Vision-Konsole hinzu.

  • Importieren Sie Bilder aus einem S3-Bucket. Amazon Lookout for Vision kann Bilder klassifizieren, indem es die Ordnernamen verwendet, um die Bilder zu beschriften. normalFür normale Bilder verwenden. anomalyFür anomale Bilder verwenden. Sie können Segmentierungslabels nicht automatisch zuweisen.

  • Importieren Sie eine Amazon SageMaker Ground Truth Manifest-Datei, die beschriftete Bilder enthält. Sie können Ihre eigene Manifestdatei erstellen und importieren. Wenn Sie viele Bilder haben, sollten Sie den SageMaker Ground Truth Labeling-Service in Betracht ziehen. Anschließend importieren Sie die Ausgabe-Manifestdatei aus dem Amazon SageMaker Ground Truth Job. Bei Bedarf können Sie die Lookout for Vision Vision-Konsole verwenden, um Beschriftungen hinzuzufügen oder zu ändern.

Wenn Sie den verwenden AWS SDK, erstellen Sie einen Datensatz mit einer Amazon SageMaker Ground Truth Manifestdatei. Weitere Informationen finden Sie unter Erstellen eines Datensatzes mithilfe einer Amazon SageMaker Ground Truth Manifestdatei.

Wenn Ihre Bilder nach der Erstellung Ihres Datensatzes beschriftet sind, können Sie das Modell trainieren. Wenn die Bilder nicht beschriftet sind, fügen Sie die Beschriftungen entsprechend dem Modelltyp hinzu, den Sie erstellen möchten. Weitere Informationen finden Sie unter Labeling von Bildern.

Sie können einem vorhandenen Datensatz weitere Bilder hinzufügen. Weitere Informationen finden Sie unter Hinzufügen von Bildern zu Ihrem Datensatz.