COCODas Datensatzformat - Rekognition

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

COCODas Datensatzformat

Ein COCO Datensatz besteht aus fünf Informationsabschnitten, die Informationen für den gesamten Datensatz bereitstellen. Das Format für einen Datensatz zur COCO Objekterkennung ist unter COCODatenformat dokumentiert.

  • Info – allgemeine Informationen über den Datensatz.

  • licenses – Lizenzinformationen für die Bilder im Datensatz.

  • images – eine Liste der Bilder im Datensatz.

  • annotations – eine Liste von Anmerkungen (einschließlich Begrenzungsrahmen), die in allen Bildern im Datensatz vorhanden sind.

  • categories – eine Liste von Label-Kategorien.

Um ein Manifest mit benutzerdefinierten Bezeichnungen zu erstellenimages, verwenden Sie die categories Listenannotations, und aus der COCO Manifestdatei. Die anderen Abschnitte (info,licences) sind nicht erforderlich. Im Folgenden finden Sie ein Beispiel für eine COCO Manifestdatei.

{ "info": { "description": "COCO 2017 Dataset","url": "http://cocodataset.org","version": "1.0","year": 2017,"contributor": "COCO Consortium","date_created": "2017/09/01" }, "licenses": [ {"url": "http://creativecommons.org/licenses/by/2.0/","id": 4,"name": "Attribution License"} ], "images": [ {"id": 242287, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/xxxxxxxxxxxx.jpg", "flickr_url": "http://farm3.staticflickr.com/2626/xxxxxxxxxxxx.jpg", "width": 426, "height": 640, "file_name": "xxxxxxxxx.jpg", "date_captured": "2013-11-15 02:41:42"}, {"id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/xxxxxxxxxxxx.jpg", "width": 640, "height": 480, "file_name": "nnnnnnnnnn.jpg", "date_captured": "2013-11-18 02:53:27"} ], "annotations": [ {"id": 125686, "category_id": 0, "iscrowd": 0, "segmentation": [[164.81, 417.51,......167.55, 410.64]], "image_id": 242287, "area": 42061.80340000001, "bbox": [19.23, 383.18, 314.5, 244.46]}, {"id": 1409619, "category_id": 0, "iscrowd": 0, "segmentation": [[376.81, 238.8,........382.74, 241.17]], "image_id": 245915, "area": 3556.2197000000015, "bbox": [399, 251, 155, 101]}, {"id": 1410165, "category_id": 1, "iscrowd": 0, "segmentation": [[486.34, 239.01,..........495.95, 244.39]], "image_id": 245915, "area": 1775.8932499999994, "bbox": [86, 65, 220, 334]} ], "categories": [ {"supercategory": "speaker","id": 0,"name": "echo"}, {"supercategory": "speaker","id": 1,"name": "echo dot"} ] }

Liste der Bilder

Die Bilder, auf die ein COCO Datensatz verweist, sind im Bilderarray aufgeführt. Jedes Bildobjekt enthält Informationen über das Bild, z. B. den Namen der Bilddatei. Notieren Sie sich im folgenden Beispiel-Bildobjekt die folgenden Informationen und welche Felder erforderlich sind, um eine Amazon Rekognition Custom Labels-Manifestdatei zu erstellen.

  • id – (Erforderlich) Eine eindeutige Kennung für das Bild. Das id-Feld ist dem id-Feld im Annotationsarray zugeordnet (in dem Begrenzungsrahmen-Informationen gespeichert werden).

  • license – (Nicht erforderlich) Entspricht dem Lizenz-Array.

  • coco_url – (Optional) Den Speicherort des Bildes.

  • flickr_url – (Nicht erforderlich) Der Speicherort des Bildes auf Flickr.

  • width – (Erforderlich) Die Breite des Bildes.

  • height – (Erforderlich) Die Höhe des Bildes.

  • file_name – (Erforderlich) Der Name der Bilddatei. In diesem Beispiel stimmen sie id überein, aber das ist keine Voraussetzung für COCO Datensätze. file_name

  • date_captured – (Erforderlich) Datum und Uhrzeit der Aufnahme des Bildes.

{ "id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/nnnnnnnnnnnnnnnnnnn.jpg", "width": 640, "height": 480, "file_name": "000000245915.jpg", "date_captured": "2013-11-18 02:53:27" }

Liste der Anmerkungen (Begrenzungsfelder)

Die Begrenzungsrahmeninformationen für alle Objekte auf allen Bildern werden in der Liste der Anmerkungen gespeichert. Ein einzelnes Anmerkungsobjekt enthält Begrenzungsrahmeninformationen für ein einzelnes Objekt und die Bezeichnung des Objekts auf einem Bild. Für jede Instance eines Objekts auf einem Bild gibt es ein Anmerkungsobjekt.

Notieren Sie sich im folgenden Beispiel die folgenden Informationen und welche Felder erforderlich sind, um eine Amazon Rekognition Custom Labels-Manifestdatei zu erstellen.

  • id – (Nicht erforderlich) Die Kennung für die Anmerkung.

  • image_id – (Erforderlich) Entspricht dem Bild id im Bildarray.

  • category_id – (Erforderlich) Der Bezeichner für das Label, das das Objekt innerhalb eines Begrenzungsrahmens identifiziert. Er wird dem id-Feld des Kategorien-Arrays zugeordnet.

  • iscrowd – (Nicht erforderlich) Gibt an, ob das Bild eine Menge von Objekten enthält.

  • segmentation – (Nicht erforderlich) Segmentierungsinformationen für Objekte auf einem Bild. Amazon Rekognition Custom Labels unterstützt keine Segmentierung.

  • area – (Nicht erforderlich) Der Bereich der Anmerkung.

  • bbox – (Erforderlich) Enthält die Koordinaten eines Begrenzungsrahmens, der ein Objekt auf dem Bild umgibt, in Pixeln.

{ "id": 1409619, "category_id": 1, "iscrowd": 0, "segmentation": [ [86.0, 238.8,..........382.74, 241.17] ], "image_id": 245915, "area": 3556.2197000000015, "bbox": [86, 65, 220, 334] }

Liste der Kategorien

Labelinformationen werden im Kategorien-Array gespeichert. Notieren Sie sich im folgenden Beispiel für ein Kategorie-Objekt die folgenden Informationen und welche Felder erforderlich sind, um eine Amazon Rekognition Custom Labels-Manifestdatei zu erstellen.

  • supercategory – (Nicht erforderlich) Die übergeordnete Kategorie für ein Label.

  • id – (Erforderlich) Die Label-ID. Das id-Feld ist dem category_id-Feld in einem annotation-Objekt zugeordnet. Im folgenden Beispiel ist der Identifier für einen Echo Dot 2.

  • name – (Erforderlich) Der Labelname.

{"supercategory": "speaker","id": 2,"name": "echo dot"}