Verketten von Kennzeichnungsaufträgen - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verketten von Kennzeichnungsaufträgen

Amazon SageMaker Ground Truth kann Datensätze aus früheren Aufträgen auf zwei Arten wiederverwenden: Klonen und Verketten.

Beim Klonen wird die Einrichtung des vorherigen Kennzeichnungsauftrags kopiert. Ihnen wird außerdem die Möglichkeit gegeben, weitere Änderungen daran vorzunehmen, bevor Sie ihn als auszuführend einstellen.

Verkettung verwendet nicht nur die Einrichtung des vorherigen Auftrags, sondern auch dessen Ergebnisse. So können Sie einen unvollständigen Auftrag fortsetzen und einem abgeschlossenen Auftrag Kennzeichnungen oder Datenobjekte hinzufügen. Die Verkettung ist eine komplexe Operation.

Zur Datenverarbeitung:

  • Beim Klonen verwendet das Eingabe-Manifest des vorherigen Auftrags mit optionalen Änderungen als Eingabemanifest des neuen Auftrags.

  • Beim Verketten wird das Ausgabe-Manifestdatei des vorherigen Auftrags als Eingabemanifest des neuen Auftrags verwendet.

Verkettung ist nützlich, wenn Sie Folgendes tun müssen:

  • Fortführung eines manuell gestoppten Kennzeichnungsauftrags.

  • Fortführung eines Kennzeichnungsauftrags, der mittendrin fehlschlug, nachdem Sie die Probleme behoben haben.

  • Wechsel zum automatischen Daten-Labeling, nachdem ein Teil des Auftrags manuell gekennzeichnet wurde (oder umgekehrt).

  • Hinzufügen weiterer Datenobjekte zu einem abgeschlossenen Auftrag und Starten des Auftrags ab diesem Punkt.

  • Hinzufügen weiterer Anmerkungen zu einem abgeschlossenen Auftrag. Beispiel: Sie haben eine Sammlung von Phrasen für ein Thema gekennzeichnet und möchten das Dataset erneut ausführen und nach der voraussichtlichen Zielgruppe des Themas kategorisieren.

In Amazon SageMaker Ground Truth können Sie einen verketteten Kennzeichnungsauftrag entweder mit der Konsole oder der API konfigurieren.

Schlüsselbegriff: Kennzeichnungsattributname

Die Zeichenfolge des Kennzeichnungsattributnamen (LabelAttributeName in der API) wird als Schlüssel für das Schlüssel-Wert-Paar verwendet, das mit der Kennzeichnung gebildet wird, die ein Worker einem Datenobjekt zuweist.

Für den Kennzeichnungsattributnamen gelten die folgenden Regeln:

  • Er kann nicht mit -metadata enden.

  • Die Namen source und source-ref sind reserviert und dürfen nicht verwendet werden.

  • Bei Kennzeichnungsaufträgen zur semantischen Segmentierung muss er mit -ref enden. Für alle anderen Kennzeichnungsaufträge kann er nicht auf -ref enden. Wenn Sie die Konsole verwenden, um den Auftrag zu erstellen, hängt Amazon SageMaker Ground Truth automatisch -ref an alle Beschriftungsattributnamen an, mit Ausnahme von semantischen Segmentierungsaufträgen.

  • Wenn Sie bei einem verketteten Kennzeichnungsauftrag den gleichen Kennzeichnungsattributnamen wie bei dem ursprünglichen Auftrag verwenden und den verketteten Auftrag für automatische Kennzeichnung konfigurieren, dann verwendet Ground Truth, sofern zu irgendeinem Zeitpunkt der Modus zur automatischen Kennzeichnung aktiv war, das Modell des ursprünglichen Auftrags.

In einem Ausgabemanifest wird der Kennzeichnungsattributname ähnlich dem folgenden angezeigt.

"source-ref": "<S3 URI>", "<label attribute name>": { "annotations": [{ "class_id": 0, "width": 99, "top": 87, "height": 62, "left": 175 }], "image_size": [{ "width": 344, "depth": 3, "height": 234 }] }, "<label attribute name>-metadata": { "job-name": "<job name>", "class-map": { "0": "<label attribute name>" }, "human-annotated": "yes", "objects": [{ "confidence": 0.09 }], "creation-date": "<timestamp>", "type": "groundtruth/object-detection" }

Wenn Sie beim Erstellen eines Auftrags in der Konsole nicht explizit einen Wert für den Kennzeichnungsattributnamen festlegen, verwendet Ground Truth den Auftragsnamen als Kennzeichnungsattributnamen des Auftrags.

Starten eines verketteten Auftrags (Konsole)

Wählen Sie einen angehaltenen, fehlgeschlagenen oder abgeschlossenen Kennzeichnungsauftrag aus der Liste der vorhandenen Aufträge aus. Das Menü Actions (Aktionen) wird aktiviert.

Wählen Sie im Menü Actions (Aktionen) die Option Chain (Verketten) aus.

Auftragsübersicht

Im Bereich Job overview (Auftragsübersicht) wird ein neuer Job name (Auftragsname) basierend auf dem Auftragstitel festgelegt, auf dem diese Verkettung basiert. Er kann angepasst werden.

Sie können auch einen anderen Kennzeichnungsattributnamen als den Namen des Kennzeichnungsauftrags verwenden.

Wenn Sie eine Verkettung aus einem abgeschlossenen Auftrag erstellen, wird als Kennzeichnungsattributname der Name des neu konfigurierten Auftrags verwendet. Aktivieren Sie das Kontrollkästchen, um den Namen zu ändern.

Wenn Sie eine Verkettung aus einem angehaltenen oder fehlgeschlagenen Auftrag erstellen, wird als Kennzeichnungsattributname der Name des Auftrags verwendet, von dem aus die Verkettung erstellt wird. Der Wert kann einfach angezeigt und bearbeitet werden, da das Namenskontrollkästchen aktiviert ist.

Überlegungen zur Benennung der Attributskennzeichnung
  • Standardmäßig wird der von Ground Truth ausgewählte Kennzeichnungsattributname verwendet. Alle Datenobjekte, die nicht mit diesem Kennzeichnungsattributnamen verknüpft sind, werden gekennzeichnet.

  • Die Verwendung eines Kennzeichnungsattributnamens, der nicht im Manifest vorhanden ist, führt dazu, dass alle Objekte im Dataset verarbeitet werden.

Der Speicherort des Eingabe-Datasets wird in diesem Fall automatisch als Ausgabemanifest des verketteten Auftrags ausgewählt. Das Eingabefeld ist nicht verfügbar und kann somit auch nicht geändert werden.

Hinzufügen von Datenobjekten zu einem Kennzeichnungsauftrag

Sie können keine alternative Manifestdatei angeben. Bearbeiten Sie die Ausgabemanifestdatei des vorherigen Auftrags manuell, um neue Elemente hinzuzufügen, bevor Sie einen verketteten Auftrag starten. Anhand der Amazon-S3-URI können Sie den Speicherort der Manifestdatei in Ihrem Amazon-S3-Bucket finden. Laden Sie die Manifestdatei dort herunter, bearbeiten Sie sie lokal auf Ihrem Computer und laden Sie die neue Version wieder hoch. Achten Sie darauf, beim Bearbeiten keine Fehler einzubauen. Wir empfehlen, Ihre JSON-Datei mit JSON Linter zu überprüfen. Für viele gängige Texteditoren und IDEs gibt es Linter-Plugins.

Starten eines verketteten Auftrags (API)

Das Verfahren ist nahezu identisch mit dem Einrichten eines neuen Kennzeichnungsauftrags mit CreateLabelingJob, bis auf zwei wesentliche Unterschiede:

  • Speicherort des Manifests: Statt das ursprüngliche Manifest des vorherigen Auftrags zu verwenden, sollte der Wert für die ManifestS3Uri in DataSource auf die Amazon-S3-URI des Ausgabemanifests des vorherigen Kennzeichnungsauftrags verweisen.

  • Kennzeichnungsattributname: Es ist wichtig, hier den korrekten Wert für LabelAttributeName festzulegen. Dies ist der Schlüssel des Schlüssel-Wert-Paars, wobei die Kennzeichnungsdaten der Wert sind. Beispiel-Anwendungsfälle umfassen:

    • Hinzufügen neuer oder spezifischerer Kennzeichnungen zu einem abgeschlossenen Auftrag – Geben Sie einen neuen Kennzeichnungsattributnamen ein.

    • Kennzeichnen der nicht gekennzeichneten Artikel aus einem früheren Auftrag – Verwenden Sie den Kennzeichnungsattributnamen aus dem vorherigen Auftrag.

Verwenden eines teilweise gekennzeichneten Datasets

Sie profitieren von der Verkettung, wenn Sie ein erweitertes, bereits teilweise gekennzeichnetes Manifest verwenden. Aktivieren Sie das Kontrollkästchen Label attribute name (Kennzeichnungsattributwert) und legen Sie den Namen so fest, dass er mit dem Namen in Ihrem Manifest übereinstimmt.

Befolgen Sie bei Verwendung der API dieselben Anweisungen wie beim Starten eines verketteten Auftrags. Achten Sie jedoch darauf, dass Sie das Manifest in einen Amazon-S3-Bucket hochladen und dieses anstelle des Ausgabemanifests des vorherigen Auftrags verwenden.

Der Wert Kennzeichnungsattributname in der Manifestdatei muss mit den oben genannten Überlegungen zur Namensgebung übereinstimmen.