Formato COCO - Rekognition

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Formato COCO

Um conjunto de dados COCO consiste de cinco seções de informações que fornecem informações para todo o conjunto de dados. O formato de um conjunto de dados de detecção de objetos COCO está documentado em COCO Data Format.

  • info: as informações gerais sobre o conjunto de dados.

  • licences: informações de licença para as imagens no conjunto de dados.

  • images: uma lista de imagens no conjunto de dados.

  • annotations: uma lista de anotações (incluindo caixas delimitadoras) que estão presentes em todas as imagens no conjunto de dados.

  • categories: uma lista de categorias de rótulo.

Para criar um manifesto de rótulos personalizados, você usa as listas images, annotations e categories do arquivo de manifesto COCO. As outras seções (info, licences) não são obrigatórias. Veja a seguir um exemplo de arquivo de manifesto COCO.

{ "info": { "description": "COCO 2017 Dataset","url": "http://cocodataset.org","version": "1.0","year": 2017,"contributor": "COCO Consortium","date_created": "2017/09/01" }, "licenses": [ {"url": "http://creativecommons.org/licenses/by/2.0/","id": 4,"name": "Attribution License"} ], "images": [ {"id": 242287, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/xxxxxxxxxxxx.jpg", "flickr_url": "http://farm3.staticflickr.com/2626/xxxxxxxxxxxx.jpg", "width": 426, "height": 640, "file_name": "xxxxxxxxx.jpg", "date_captured": "2013-11-15 02:41:42"}, {"id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/xxxxxxxxxxxx.jpg", "width": 640, "height": 480, "file_name": "nnnnnnnnnn.jpg", "date_captured": "2013-11-18 02:53:27"} ], "annotations": [ {"id": 125686, "category_id": 0, "iscrowd": 0, "segmentation": [[164.81, 417.51,......167.55, 410.64]], "image_id": 242287, "area": 42061.80340000001, "bbox": [19.23, 383.18, 314.5, 244.46]}, {"id": 1409619, "category_id": 0, "iscrowd": 0, "segmentation": [[376.81, 238.8,........382.74, 241.17]], "image_id": 245915, "area": 3556.2197000000015, "bbox": [399, 251, 155, 101]}, {"id": 1410165, "category_id": 1, "iscrowd": 0, "segmentation": [[486.34, 239.01,..........495.95, 244.39]], "image_id": 245915, "area": 1775.8932499999994, "bbox": [86, 65, 220, 334]} ], "categories": [ {"supercategory": "speaker","id": 0,"name": "echo"}, {"supercategory": "speaker","id": 1,"name": "echo dot"} ] }

lista de imagens

As imagens referenciadas por um conjunto de dados COCO são listadas na matriz de imagens. Cada objeto de imagem contém informações sobre a imagem, como o nome do arquivo da imagem. No exemplo de objeto de imagem a seguir, observe as seguintes informações e quais campos são necessários para criar um arquivo de manifesto Amazon Rekognition Custom Labels.

  • id: (obrigatório) um identificador exclusivo para a imagem. O campo id mapeia para o campo id na matriz de anotações (onde as informações da caixa delimitadora são armazenadas).

  • license: (não obrigatória) mapeia para a matriz de licenças.

  • coco_url: (opcional) o local da imagem.

  • flickr_url: (não obrigatório) o local da imagem no Flickr.

  • width: (obrigatório) a largura da imagem.

  • height: (obrigatório) a altura da imagem.

  • file_name: (obrigatório) o nome do arquivo de imagem. Neste exemplo, file_name e id combinam, mas não é um requisito para conjuntos de dados COCO.

  • date_captured: (obrigatória) a data e a hora em que a imagem foi capturada.

{ "id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/nnnnnnnnnnnnnnnnnnn.jpg", "width": 640, "height": 480, "file_name": "000000245915.jpg", "date_captured": "2013-11-18 02:53:27" }

lista de anotações (caixas delimitadoras)

As informações da caixa delimitadora de todos os objetos em todas as imagens são armazenadas na lista de anotações. Um único objeto de anotação contém informações da caixa delimitadora de um único objeto e o rótulo do objeto em uma imagem. Há um objeto de anotação para cada instância de um objeto em uma imagem.

No exemplo a seguir, observe as seguintes informações e quais campos são necessários para criar um arquivo de manifesto Amazon Rekognition Custom Labels.

  • id: (não obrigatório) o identificador da anotação.

  • image_id: (obrigatório) corresponde ao id da imagem na matriz de imagens.

  • category_id: (obrigatório) o identificador da etiqueta que identifica o objeto dentro de uma caixa delimitadora. Ele mapeia para o campo id da matriz de categorias.

  • iscrowd: (não obrigatório) especifica se a imagem contém uma multidão de objetos.

  • segmentation: (não obrigatória) informações de segmentação de objetos em uma imagem. O Amazon Rekognition Custom Labels não é compatível com a segmentação.

  • area: (não obrigatória) a área da anotação.

  • bbox: (obrigatório) contém as coordenadas, em pixels, de uma caixa delimitadora ao redor de um objeto na imagem.

{ "id": 1409619, "category_id": 1, "iscrowd": 0, "segmentation": [ [86.0, 238.8,..........382.74, 241.17] ], "image_id": 245915, "area": 3556.2197000000015, "bbox": [86, 65, 220, 334] }

lista de categorias

As informações do rótulo são armazenadas na matriz de categorias. No exemplo de objeto de categoria a seguir, observe as seguintes informações e quais campos são necessários para criar um arquivo de manifesto Amazon Rekognition Custom Labels.

  • supercategory: (não obrigatória) a categoria principal de uma etiqueta.

  • id: (obrigatório) o identificador da etiqueta. O campo id mapeia para o campo category_id em um objeto annotation. No exemplo a seguir, o identificador de um ponto de eco é 2.

  • name: (obrigatório) o nome do rótulo.

{"supercategory": "speaker","id": 2,"name": "echo dot"}