COCO 형식 - Rekognition

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

COCO 형식

COCO 데이터 세트는 전체 데이터 세트에 대한 정보를 제공하는 다섯 개의 항목으로 구성됩니다. COCO 객체 감지 데이터 세트의 형식은 COCO 데이터 형식에 문서화되어 있습니다.

  • 정보: 데이터 세트에 대한 일반 정보입니다.

  • 라이선스: 데이터 세트의 이미지에 대한 라이선스 정보입니다.

  • 이미지: 데이터 세트에 있는 이미지 목록

  • 주석: 데이터 세트의 모든 이미지에 있는 주석(경계 상자 포함)의 목록

  • 카테고리: 레이블 카테고리 목록

사용자 지정 레이블 매니페스트를 만들려면 COCO 매니페스트 파일의 images, annotations, categories 목록을 사용하세요. 다른 항목(info, licences)은 필수가 아닙니다. 다음은 COCO 매니페스트 파일의 예제입니다.

{ "info": { "description": "COCO 2017 Dataset","url": "http://cocodataset.org","version": "1.0","year": 2017,"contributor": "COCO Consortium","date_created": "2017/09/01" }, "licenses": [ {"url": "http://creativecommons.org/licenses/by/2.0/","id": 4,"name": "Attribution License"} ], "images": [ {"id": 242287, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/xxxxxxxxxxxx.jpg", "flickr_url": "http://farm3.staticflickr.com/2626/xxxxxxxxxxxx.jpg", "width": 426, "height": 640, "file_name": "xxxxxxxxx.jpg", "date_captured": "2013-11-15 02:41:42"}, {"id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/xxxxxxxxxxxx.jpg", "width": 640, "height": 480, "file_name": "nnnnnnnnnn.jpg", "date_captured": "2013-11-18 02:53:27"} ], "annotations": [ {"id": 125686, "category_id": 0, "iscrowd": 0, "segmentation": [[164.81, 417.51,......167.55, 410.64]], "image_id": 242287, "area": 42061.80340000001, "bbox": [19.23, 383.18, 314.5, 244.46]}, {"id": 1409619, "category_id": 0, "iscrowd": 0, "segmentation": [[376.81, 238.8,........382.74, 241.17]], "image_id": 245915, "area": 3556.2197000000015, "bbox": [399, 251, 155, 101]}, {"id": 1410165, "category_id": 1, "iscrowd": 0, "segmentation": [[486.34, 239.01,..........495.95, 244.39]], "image_id": 245915, "area": 1775.8932499999994, "bbox": [86, 65, 220, 334]} ], "categories": [ {"supercategory": "speaker","id": 0,"name": "echo"}, {"supercategory": "speaker","id": 1,"name": "echo dot"} ] }

이미지 목록

COCO 데이터 세트에서 참조하는 이미지는 이미지 배열에 나열됩니다. 각 이미지 객체에는 이미지 파일 이름과 같은 이미지에 대한 정보가 들어 있습니다. 다음 예제 이미지 객체에서 다음 정보와 Amazon Rekognition Custom Labels 매니페스트 파일을 생성하는 데 필요한 필드를 기록해 둡니다.

  • id: (필수) 이미지의 고유 식별자 id 필드는 주석 배열(경계 상자 정보가 저장되는 위치)의 id 필드에 매핑됩니다.

  • license: (필수 아님) 라이선스 어레이에 매핑됩니다.

  • coco_url: (선택 사항) 이미지의 위치

  • flickr_url: (필수 아님) Flickr에서의 이미지 위치

  • width: (필수) 이미지의 너비

  • height: (필수) 이미지의 높이

  • file_name: (필수) 이미지 파일 이름 이 예제에서 file_nameid는 일치하지만 COCO 데이터 세트의 요구 사항은 아닙니다.

  • date_captured: (필수) 이미지를 캡처한 날짜 및 시간

{ "id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/nnnnnnnnnnnnnnnnnnn.jpg", "width": 640, "height": 480, "file_name": "000000245915.jpg", "date_captured": "2013-11-18 02:53:27" }

주석(경계 상자) 목록

모든 이미지에 있는 모든 객체의 경계 상자 정보는 주석 목록에 저장됩니다. 단일 주석 개체에는 단일 개체에 대한 경계 상자 정보와 이미지의 개체 레이블이 포함됩니다. 이미지에 있는 객체의 각 인스턴스에는 주석 개체가 있습니다.

다음 예제에서 다음 정보와 Amazon Rekognition Custom Labels 매니페스트 파일을 생성하는 데 필요한 필드를 기록해 둡니다.

  • id: (필수 아님) 주석의 식별자

  • image_id: (필수) 이미지 배열의 id 이미지에 대응합니다.

  • category_id: (필수) 경계 상자 내의 객체를 식별하는 레이블의 식별자입니다. 카테고리 배열의 id 필드에 매핑됩니다.

  • iscrowd: (필수 아님) 이미지에 많은 객체가 포함되어 있는지 여부를 지정합니다.

  • segmentation: (필수 아님) 이미지 상의 객체에 대한 세그멘트화 정보입니다. Amazon Rekognition Custom Labels는 세그멘트화를 지원하지 않습니다.

  • area: (필수 아님) 주석의 영역

  • bbox: (필수) 이미지에 있는 객체 주위의 경계 상자 좌표(픽셀 단위)를 포함합니다.

{ "id": 1409619, "category_id": 1, "iscrowd": 0, "segmentation": [ [86.0, 238.8,..........382.74, 241.17] ], "image_id": 245915, "area": 3556.2197000000015, "bbox": [86, 65, 220, 334] }

카테고리 목록

레이블 정보는 카테고리 배열에 저장됩니다. 다음 예제 카테고리 객체에서 다음 정보와 Amazon Rekognition Custom Labels 매니페스트 파일을 생성하는 데 필요한 필드를 기록해 둡니다.

  • supercategory: (필수 아님) 레이블의 상위 카테고리

  • id: (필수) 레이블 식별자 id 필드는 annotation 객체의 category_id 필드에 매핑됩니다. 다음 예제에서 에코 도트의 식별자는 2입니다.

  • name: (필수) 레이블 이름

{"supercategory": "speaker","id": 2,"name": "echo dot"}