Formato COCO - Rekognition

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Formato COCO

Un conjunto de datos COCO consta de cinco secciones de información que aportan información para todo el conjunto de datos. El formato de un conjunto de datos de detección de objetos COCO viene documentado en Formato de datos COCO.

  • info: información general sobre el conjunto de datos.

  • licenses: información de las licencias de imágenes del conjunto de datos.

  • images: lista de imágenes del conjunto de datos.

  • annotations: lista de anotaciones (incluidos los cuadros delimitadores) que están presentes en todas las imágenes del conjunto de datos.

  • categories: lista de categorías de etiquetas.

Para crear un manifiesto de etiquetas personalizadas, utilice las listas images, annotations y categories del archivo de manifiesto COCO. Las demás secciones (info, licences) no son obligatorias. A continuación se muestra un ejemplo de un archivo de manifiesto COCO.

{ "info": { "description": "COCO 2017 Dataset","url": "http://cocodataset.org","version": "1.0","year": 2017,"contributor": "COCO Consortium","date_created": "2017/09/01" }, "licenses": [ {"url": "http://creativecommons.org/licenses/by/2.0/","id": 4,"name": "Attribution License"} ], "images": [ {"id": 242287, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/xxxxxxxxxxxx.jpg", "flickr_url": "http://farm3.staticflickr.com/2626/xxxxxxxxxxxx.jpg", "width": 426, "height": 640, "file_name": "xxxxxxxxx.jpg", "date_captured": "2013-11-15 02:41:42"}, {"id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/xxxxxxxxxxxx.jpg", "width": 640, "height": 480, "file_name": "nnnnnnnnnn.jpg", "date_captured": "2013-11-18 02:53:27"} ], "annotations": [ {"id": 125686, "category_id": 0, "iscrowd": 0, "segmentation": [[164.81, 417.51,......167.55, 410.64]], "image_id": 242287, "area": 42061.80340000001, "bbox": [19.23, 383.18, 314.5, 244.46]}, {"id": 1409619, "category_id": 0, "iscrowd": 0, "segmentation": [[376.81, 238.8,........382.74, 241.17]], "image_id": 245915, "area": 3556.2197000000015, "bbox": [399, 251, 155, 101]}, {"id": 1410165, "category_id": 1, "iscrowd": 0, "segmentation": [[486.34, 239.01,..........495.95, 244.39]], "image_id": 245915, "area": 1775.8932499999994, "bbox": [86, 65, 220, 334]} ], "categories": [ {"supercategory": "speaker","id": 0,"name": "echo"}, {"supercategory": "speaker","id": 1,"name": "echo dot"} ] }

images list

Las imágenes a las que hace referencia un conjunto de datos COCO figuran en la matriz de imágenes. Cada objeto de imagen contiene información sobre la imagen, como el nombre de archivo de la imagen. En el siguiente objeto de imagen de ejemplo, fíjese en la siguiente información y los campos necesarios para crear un archivo de manifiesto de Etiquetas personalizadas de Amazon Rekognition.

  • id: (Obligatorio) Un identificador único para la imagen. El campo id se asigna al campo id de la matriz de anotaciones (donde se almacena la información del cuadro delimitador).

  • license: (No obligatorio) Se asigna a la matriz de licencias.

  • coco_url: (Opcional) La ubicación de la imagen.

  • flickr_url: (No obligatorio) La ubicación de la imagen en Flickr.

  • width: (Obligatorio) El ancho de la imagen.

  • height: (Obligatorio) La altura de la imagen.

  • file_name: (Obligatorio) El nombre del archivo de imagen. En este ejemplo, file_name y id coinciden, pero esto no es un requisito para los conjuntos de datos COCO.

  • date_captured: (Obligatorio) La fecha y la hora en que se capturó la imagen.

{ "id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/nnnnnnnnnnnnnnnnnnn.jpg", "width": 640, "height": 480, "file_name": "000000245915.jpg", "date_captured": "2013-11-18 02:53:27" }

lista de anotaciones (cuadros delimitadores)

La información de los cuadros delimitadores de todos los objetos en todas las imágenes se almacena en la lista de anotaciones. Un único objeto de anotación contiene la información del cuadro delimitador de un único objeto y la etiqueta del objeto en una imagen. Hay un objeto de anotación por cada instancia de un objeto en una imagen.

En el siguiente ejemplo, fíjese en la siguiente información y los campos necesarios para crear un archivo de manifiesto de Etiquetas personalizadas de Amazon Rekognition.

  • id: (No obligatorio) El identificador de la anotación.

  • image_id: (Obligatorio) Corresponde a la imagen id en la matriz de imágenes.

  • category_id: (Obligatorio) El identificador de la etiqueta que identifica el objeto dentro de un cuadro delimitador. Se asigna al campo id de la matriz de categorías.

  • iscrowd: (No obligatorio) Señala si la imagen tiene muchos objetos.

  • segmentation: (No obligatorio) Información de segmentación de los objetos de una imagen. Etiquetas personalizadas de Amazon Rekognition no admite la segmentación.

  • area: (No obligatorio) El área de la anotación.

  • bbox: (Obligatorio) Incluye las coordenadas, en píxeles, de un cuadro delimitador alrededor de un objeto de la imagen.

{ "id": 1409619, "category_id": 1, "iscrowd": 0, "segmentation": [ [86.0, 238.8,..........382.74, 241.17] ], "image_id": 245915, "area": 3556.2197000000015, "bbox": [86, 65, 220, 334] }

lista de categorías

La información de las etiquetas se almacena en la matriz de categorías. En el siguiente objeto de categoría de ejemplo, fíjese en la siguiente información y los campos necesarios para crear un archivo de manifiesto de Etiquetas personalizadas de Amazon Rekognition.

  • supercategory: (No obligatorio) La categoría principal de una etiqueta.

  • id: (Obligatorio) El identificador de la etiqueta. El campo id se asigna al campo category_id de un objeto annotation. En el siguiente ejemplo, el identificador de un echo dot es 2.

  • name: (Obligatorio) El nombre de la etiqueta.

{"supercategory": "speaker","id": 2,"name": "echo dot"}