Localizzazione di oggetti nei file manifest - Rekognition

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Localizzazione di oggetti nei file manifest

È possibile importare immagini etichettate con informazioni sulla localizzazione degli oggetti aggiungendo righe JSON in formato SageMaker Ground Truth Bounding Box Job Output a un file manifest.

Le informazioni di localizzazione rappresentano la posizione di un oggetto in un'immagine. La posizione è rappresentata da un riquadro di delimitazione che circonda l'oggetto. La struttura del riquadro di delimitazione contiene le coordinate in alto a sinistra e la larghezza e l'altezza del riquadro di delimitazione. Una riga JSON in formato riquadro di delimitazione include riquadri di delimitazione per le posizioni di uno o più oggetti e la classe di ciascun di essi in un'immagine.

Un file manifest è composto da una o più righe JSON, ogni riga contiene le informazioni per una singola immagine.

Creare un file manifest per la localizzazione degli oggetti
  1. Creare un file di testo vuoto.

  2. Aggiungere una riga JSON per ogni immagine che si vuole importare. Ogni riga JSON dovrebbe essere simile a quanto segue.

    {"source-ref": "s3://bucket/images/IMG_1186.png", "bounding-box": {"image_size": [{"width": 640, "height": 480, "depth": 3}], "annotations": [{ "class_id": 1, "top": 251, "left": 399, "width": 155, "height": 101}, {"class_id": 0, "top": 65, "left": 86, "width": 220, "height": 334}]}, "bounding-box-metadata": {"objects": [{ "confidence": 1}, {"confidence": 1}], "class-map": {"0": "Echo", "1": "Echo Dot"}, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2013-11-18T02:53:27", "job-name": "my job"}}
  3. Salvare il file. È possibile utilizzare l'estensione.manifest, ma non è necessaria.

  4. Creare un set di dati, usando il file che è appena stato creato. Per ulteriori informazioni, consulta Per creare un set di dati utilizzando un file manifest in formato SageMaker Ground Truth (console).

Oggetto riquadro di delimitazione righe JSON

In questa sezione viene mostrato come creare una riga JSON per una singola immagine. L'immagine seguente mostra i riquadri di delimitazione attorno ai dispositivi Amazon Echo e Amazon Echo Dot.

Di seguito è riportata la riga JSON del riquadro di delimitazione per l'immagine precedente.

{ "source-ref": "s3://custom-labels-bucket/images/IMG_1186.png", "bounding-box": { "image_size": [{ "width": 640, "height": 480, "depth": 3 }], "annotations": [{ "class_id": 1, "top": 251, "left": 399, "width": 155, "height": 101 }, { "class_id": 0, "top": 65, "left": 86, "width": 220, "height": 334 }] }, "bounding-box-metadata": { "objects": [{ "confidence": 1 }, { "confidence": 1 }], "class-map": { "0": "Echo", "1": "Echo Dot" }, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2013-11-18T02:53:27", "job-name": "my job" } }

Osservare le seguenti informazioni.

source-ref

(Obbligatorio) La posizione dell’immagine di Amazon S3. Il formato è "s3://BUCKET/OBJECT_PATH". Le immagini in un set di dati importato devono essere archiviate nello stesso bucket Amazon S3.

bounding-box (riquadro di delimitazione)

(Obbligatorio) L’etichetta dell'attributo. Scegliere il nome del campo. Contiene le dimensioni dell'immagine e i riquadri di delimitazione per ogni oggetto rilevato nell'immagine. Devono esserci metadati corrispondenti identificati dal nome del campo con l'aggiunta di -metadata. Ad esempio, "bounding-box-metadata".

image_size

(Obbligatorio) Un array di elemento singolo contenente la dimensione dell'immagine in pixel.

  • altezza: (obbligatorio) l'altezza dell'immagine in pixel.

  • larghezza: (obbligatorio) lo spessore dell'immagine in pixel.

  • profondità: (obbligatorio) il numero di canali nell'immagine. Per l’immagine RGB, il valore è 3. Attualmente non è utilizzato da Amazon Rekognition Custom Labels, ma è richiesto un valore.

annotations

(Obbligatorio) Un array di informazioni sul riquadro di delimitazione per ogni oggetto rilevato nell'immagine.

  • class_id: (obbligatorio) Mappare con un'etichetta in class-map. Nell'esempio precedente, l'oggetto nell'immagine con class_id di 1 è l'Echo Dot.

  • top: (obbligatorio) la distanza tra la parte superiore dell'immagine e quella del riquadro di delimitazione, in pixel.

  • left: (obbligatorio) la distanza tra la parte sinistra dell'immagine e quella del riquadro di delimitazione, in pixel.

  • larghezza: (obbligatorio) la larghezza del riquadro di delimitazione, in pixel.

  • altezza: (obbligatorio) l'altezza del riquadro di delimitazione, in pixel.

bounding-box -metadata

(Obbligatorio) Metadati sull'attributo etichetta. Il nome del campo deve essere lo stesso dell'attributo etichetta con l'aggiunta di -metadata. Un array di informazioni sui riquadri di delimitazione per ogni oggetto rilevato nell'immagine.

Oggetti

(Obbligatorio) Un array di oggetti che si trovano nell’immagine. Mappare l'array delle annotazioni per indice. L'attributo confidence non viene utilizzato da Amazon Rekognition Custom Labels.

class-map

(Obbligatorio) Una mappa delle classi che si applicano agli oggetti rilevati nell'immagine.

tipo

(Obbligatorio) Il tipo di lavoro di classificazione. "groundtruth/object-detection" identifica il lavoro come rilevamento di oggetti.

creation-date

(Obbligatorio) La data e l'ora UTC (Coordinated Universal Time) in cui è stata creata l'etichetta.

annotato dall'uomo

(Obbligatorio) Specificare "yes" se l'annotazione è stata completata da un essere umano. In caso contrario, "no".

job-name

(Obbligatorio) Il nome del lavoro che elabora l’immagine.