Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
COCODas Datensatzformat
Ein COCO Datensatz besteht aus fünf Informationsabschnitten, die Informationen für den gesamten Datensatz bereitstellen. Das Format für einen Datensatz zur COCO Objekterkennung ist unter COCODatenformat
-
Info – allgemeine Informationen über den Datensatz.
-
licenses – Lizenzinformationen für die Bilder im Datensatz.
-
images – eine Liste der Bilder im Datensatz.
-
annotations – eine Liste von Anmerkungen (einschließlich Begrenzungsrahmen), die in allen Bildern im Datensatz vorhanden sind.
-
categories – eine Liste von Label-Kategorien.
Um ein Manifest mit benutzerdefinierten Bezeichnungen zu erstellenimages
, verwenden Sie die categories
Listenannotations
, und aus der COCO Manifestdatei. Die anderen Abschnitte (info
,licences
) sind nicht erforderlich. Im Folgenden finden Sie ein Beispiel für eine COCO Manifestdatei.
{ "info": { "description": "COCO 2017 Dataset","url": "http://cocodataset.org","version": "1.0","year": 2017,"contributor": "COCO Consortium","date_created": "2017/09/01" }, "licenses": [ {"url": "http://creativecommons.org/licenses/by/2.0/","id": 4,"name": "Attribution License"} ], "images": [ {"id": 242287, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/xxxxxxxxxxxx.jpg", "flickr_url": "http://farm3.staticflickr.com/2626/xxxxxxxxxxxx.jpg", "width": 426, "height": 640, "file_name": "xxxxxxxxx.jpg", "date_captured": "2013-11-15 02:41:42"}, {"id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/xxxxxxxxxxxx.jpg", "width": 640, "height": 480, "file_name": "nnnnnnnnnn.jpg", "date_captured": "2013-11-18 02:53:27"} ], "annotations": [ {"id": 125686, "category_id": 0, "iscrowd": 0, "segmentation": [[164.81, 417.51,......167.55, 410.64]], "image_id": 242287, "area": 42061.80340000001, "bbox": [19.23, 383.18, 314.5, 244.46]}, {"id": 1409619, "category_id": 0, "iscrowd": 0, "segmentation": [[376.81, 238.8,........382.74, 241.17]], "image_id": 245915, "area": 3556.2197000000015, "bbox": [399, 251, 155, 101]}, {"id": 1410165, "category_id": 1, "iscrowd": 0, "segmentation": [[486.34, 239.01,..........495.95, 244.39]], "image_id": 245915, "area": 1775.8932499999994, "bbox": [86, 65, 220, 334]} ], "categories": [ {"supercategory": "speaker","id": 0,"name": "echo"}, {"supercategory": "speaker","id": 1,"name": "echo dot"} ] }
Liste der Bilder
Die Bilder, auf die ein COCO Datensatz verweist, sind im Bilderarray aufgeführt. Jedes Bildobjekt enthält Informationen über das Bild, z. B. den Namen der Bilddatei. Notieren Sie sich im folgenden Beispiel-Bildobjekt die folgenden Informationen und welche Felder erforderlich sind, um eine Amazon Rekognition Custom Labels-Manifestdatei zu erstellen.
-
id
– (Erforderlich) Eine eindeutige Kennung für das Bild. Dasid
-Feld ist demid
-Feld im Annotationsarray zugeordnet (in dem Begrenzungsrahmen-Informationen gespeichert werden). -
license
– (Nicht erforderlich) Entspricht dem Lizenz-Array. -
coco_url
– (Optional) Den Speicherort des Bildes. -
flickr_url
– (Nicht erforderlich) Der Speicherort des Bildes auf Flickr. -
width
– (Erforderlich) Die Breite des Bildes. -
height
– (Erforderlich) Die Höhe des Bildes. -
file_name
– (Erforderlich) Der Name der Bilddatei. In diesem Beispiel stimmen sieid
überein, aber das ist keine Voraussetzung für COCO Datensätze.file_name
-
date_captured
– (Erforderlich) Datum und Uhrzeit der Aufnahme des Bildes.
{ "id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/nnnnnnnnnnnnnnnnnnn.jpg", "width": 640, "height": 480, "file_name": "000000245915.jpg", "date_captured": "2013-11-18 02:53:27" }
Liste der Anmerkungen (Begrenzungsfelder)
Die Begrenzungsrahmeninformationen für alle Objekte auf allen Bildern werden in der Liste der Anmerkungen gespeichert. Ein einzelnes Anmerkungsobjekt enthält Begrenzungsrahmeninformationen für ein einzelnes Objekt und die Bezeichnung des Objekts auf einem Bild. Für jede Instance eines Objekts auf einem Bild gibt es ein Anmerkungsobjekt.
Notieren Sie sich im folgenden Beispiel die folgenden Informationen und welche Felder erforderlich sind, um eine Amazon Rekognition Custom Labels-Manifestdatei zu erstellen.
-
id
– (Nicht erforderlich) Die Kennung für die Anmerkung. -
image_id
– (Erforderlich) Entspricht dem Bildid
im Bildarray. -
category_id
– (Erforderlich) Der Bezeichner für das Label, das das Objekt innerhalb eines Begrenzungsrahmens identifiziert. Er wird demid
-Feld des Kategorien-Arrays zugeordnet. -
iscrowd
– (Nicht erforderlich) Gibt an, ob das Bild eine Menge von Objekten enthält. -
segmentation
– (Nicht erforderlich) Segmentierungsinformationen für Objekte auf einem Bild. Amazon Rekognition Custom Labels unterstützt keine Segmentierung. -
area
– (Nicht erforderlich) Der Bereich der Anmerkung. -
bbox
– (Erforderlich) Enthält die Koordinaten eines Begrenzungsrahmens, der ein Objekt auf dem Bild umgibt, in Pixeln.
{ "id": 1409619, "category_id": 1, "iscrowd": 0, "segmentation": [ [86.0, 238.8,..........382.74, 241.17] ], "image_id": 245915, "area": 3556.2197000000015, "bbox": [86, 65, 220, 334] }
Liste der Kategorien
Labelinformationen werden im Kategorien-Array gespeichert. Notieren Sie sich im folgenden Beispiel für ein Kategorie-Objekt die folgenden Informationen und welche Felder erforderlich sind, um eine Amazon Rekognition Custom Labels-Manifestdatei zu erstellen.
-
supercategory
– (Nicht erforderlich) Die übergeordnete Kategorie für ein Label. -
id
– (Erforderlich) Die Label-ID. Dasid
-Feld ist demcategory_id
-Feld in einemannotation
-Objekt zugeordnet. Im folgenden Beispiel ist der Identifier für einen Echo Dot 2. -
name
– (Erforderlich) Der Labelname.
{"supercategory": "speaker","id": 2,"name": "echo dot"}