Formato COCO - Rekognition

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Formato COCO

Un set di dati COCO è composto da cinque sezioni di informazioni che forniscono informazioni per l'intero set di dati. Il formato per un set di dati di rilevamento dell’oggetto COCO è documentato in COCO Data Format.

  • info: informazioni generali sul set di dati.

  • licenses : informazioni sulla licenza per le immagini nel set di dati.

  • images: un elenco di immagini nel set di dati.

  • annotations: un elenco di annotazioni (compresi i riquadri di delimitazione) presenti in tutte le immagini del set di dati.

  • categories: un elenco di categorie di etichette.

Per creare un manifest Custom Labels, utilizzare gli elenchi images, annotations e categories contenuti nel file manifest COCO. Le altre sezioni (info,licences) non sono obbligatorie. Di seguito è riportato un esempio del file manifest CSV.

{ "info": { "description": "COCO 2017 Dataset","url": "http://cocodataset.org","version": "1.0","year": 2017,"contributor": "COCO Consortium","date_created": "2017/09/01" }, "licenses": [ {"url": "http://creativecommons.org/licenses/by/2.0/","id": 4,"name": "Attribution License"} ], "images": [ {"id": 242287, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/xxxxxxxxxxxx.jpg", "flickr_url": "http://farm3.staticflickr.com/2626/xxxxxxxxxxxx.jpg", "width": 426, "height": 640, "file_name": "xxxxxxxxx.jpg", "date_captured": "2013-11-15 02:41:42"}, {"id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/xxxxxxxxxxxx.jpg", "width": 640, "height": 480, "file_name": "nnnnnnnnnn.jpg", "date_captured": "2013-11-18 02:53:27"} ], "annotations": [ {"id": 125686, "category_id": 0, "iscrowd": 0, "segmentation": [[164.81, 417.51,......167.55, 410.64]], "image_id": 242287, "area": 42061.80340000001, "bbox": [19.23, 383.18, 314.5, 244.46]}, {"id": 1409619, "category_id": 0, "iscrowd": 0, "segmentation": [[376.81, 238.8,........382.74, 241.17]], "image_id": 245915, "area": 3556.2197000000015, "bbox": [399, 251, 155, 101]}, {"id": 1410165, "category_id": 1, "iscrowd": 0, "segmentation": [[486.34, 239.01,..........495.95, 244.39]], "image_id": 245915, "area": 1775.8932499999994, "bbox": [86, 65, 220, 334]} ], "categories": [ {"supercategory": "speaker","id": 0,"name": "echo"}, {"supercategory": "speaker","id": 1,"name": "echo dot"} ] }

elenco di immagini

Le immagini a cui fa riferimento un set di dati COCO sono elencate nell'array di immagini. Ogni oggetto immagine contiene informazioni sull'immagine, come il nome del file di immagine. Nel seguente esempio di oggetto immagine, osservare le seguenti informazioni e quali campi sono necessari per creare un file manifest Amazon Rekognition Custom Labels.

  • id: (Obbligatorio) un identificatore univoco per l'immagine. Il campo id viene mappato nel campo id dell'array delle annotazioni (dove sono memorizzate le informazioni del riquadro di delimitazione).

  • license: (Non obbligatorio) mappare l'array di licenze.

  • coco_url: (Facoltativo) la posizione dell’immagine.

  • flickr_url: (Non obbligatorio) la posizione dell'immagine su Flickr.

  • width: (Obbligatorio) la larghezza dell'immagine.

  • height: (Obbligatorio) l'altezza dell'immagine.

  • file_name: (Obbligatorio) il nome del file di immagine. In questo esempio, file_name e id corrispondono, ma questo non è un requisito per i set di dati COCO.

  • date_captured: (Obbligatorio) la data e l'ora di acquisizione dell'immagine.

{ "id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/nnnnnnnnnnnnnnnnnnn.jpg", "width": 640, "height": 480, "file_name": "000000245915.jpg", "date_captured": "2013-11-18 02:53:27" }

elenco delle annotazioni (riquadri di delimitazione)

Le informazioni dei riquadri di delimitazione per tutti gli oggetti su tutte le immagini vengono memorizzate nell'elenco delle annotazioni. Un singolo oggetto di annotazione contiene le informazioni del riquadro di delimitazione per un singolo oggetto e l'etichetta dell'oggetto in un'immagine. Esiste un oggetto di annotazione per ogni istanza di un oggetto in un'immagine.

Nell'esempio seguente, annotare le seguenti informazioni e quali campi sono necessari per creare un file manifest di Amazon Rekognition Custom Labels.

  • id: (Non obbligatorio) l'identificatore per l'annotazione.

  • image_id: (Obbligatorio) corrisponde all'immagine id nell'array di immagini.

  • category_id: (Obbligatorio) l'identificatore dell'etichetta che identifica l'oggetto all'interno di un riquadro di delimitazione. Viene mappato al campo id dell'array delle categorie.

  • iscrowd: (Non obbligatorio) specificare se l'immagine contiene un gruppo di oggetti.

  • segmentation: (Non obbligatorio) informazioni sulla segmentazione degli oggetti in un'immagine. Amazon Rekognition Custom Labels non supporta la segmentazione.

  • area: (Non obbligatorio) l'area dell'annotazione.

  • bbox: (Obbligatorio) contiene le coordinate in pixel di un riquadro di delimitazione attorno a un oggetto nell'immagine.

{ "id": 1409619, "category_id": 1, "iscrowd": 0, "segmentation": [ [86.0, 238.8,..........382.74, 241.17] ], "image_id": 245915, "area": 3556.2197000000015, "bbox": [86, 65, 220, 334] }

lista di categorie

Le informazioni sull'etichetta vengono memorizzate nell'array delle categorie. Nel seguente esempio di oggetto categoria, osservare le seguenti informazioni e quali campi sono necessari per creare un file manifest di Amazon Rekognition Custom Labels.

  • supercategory: (Non obbligatorio) la categoria principale di un'etichetta.

  • id: (Obbligatorio) l'identificatore dell'etichetta. Il campo id è mappato al campo category_id di un oggetto annotation. Nell'esempio seguente, l'identificatore di un echo dot è 2.

  • name: (Obbligatorio) il nome dell'etichetta.

{"supercategory": "speaker","id": 2,"name": "echo dot"}