Format COCO dataset - Rekognition

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Format COCO dataset

COCODataset terdiri dari lima bagian informasi yang memberikan informasi untuk seluruh kumpulan data. Format untuk dataset deteksi COCO objek didokumentasikan di Format COCO Data.

  • info — informasi umum tentang dataset.

  • lisensi — informasi lisensi untuk gambar dalam dataset.

  • gambar — daftar gambar dalam dataset.

  • anotasi — daftar anotasi (termasuk kotak pembatas) yang ada di semua gambar dalam kumpulan data.

  • kategori — daftar kategori label.

Untuk membuat manifes Label Kustom, Anda menggunakanimages,annotations, dan categories daftar dari file COCO manifes. Bagian lain (info,licences) tidak diperlukan. Berikut ini adalah contoh file COCO manifes.

{ "info": { "description": "COCO 2017 Dataset","url": "http://cocodataset.org","version": "1.0","year": 2017,"contributor": "COCO Consortium","date_created": "2017/09/01" }, "licenses": [ {"url": "http://creativecommons.org/licenses/by/2.0/","id": 4,"name": "Attribution License"} ], "images": [ {"id": 242287, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/xxxxxxxxxxxx.jpg", "flickr_url": "http://farm3.staticflickr.com/2626/xxxxxxxxxxxx.jpg", "width": 426, "height": 640, "file_name": "xxxxxxxxx.jpg", "date_captured": "2013-11-15 02:41:42"}, {"id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/xxxxxxxxxxxx.jpg", "width": 640, "height": 480, "file_name": "nnnnnnnnnn.jpg", "date_captured": "2013-11-18 02:53:27"} ], "annotations": [ {"id": 125686, "category_id": 0, "iscrowd": 0, "segmentation": [[164.81, 417.51,......167.55, 410.64]], "image_id": 242287, "area": 42061.80340000001, "bbox": [19.23, 383.18, 314.5, 244.46]}, {"id": 1409619, "category_id": 0, "iscrowd": 0, "segmentation": [[376.81, 238.8,........382.74, 241.17]], "image_id": 245915, "area": 3556.2197000000015, "bbox": [399, 251, 155, 101]}, {"id": 1410165, "category_id": 1, "iscrowd": 0, "segmentation": [[486.34, 239.01,..........495.95, 244.39]], "image_id": 245915, "area": 1775.8932499999994, "bbox": [86, 65, 220, 334]} ], "categories": [ {"supercategory": "speaker","id": 0,"name": "echo"}, {"supercategory": "speaker","id": 1,"name": "echo dot"} ] }

daftar gambar

Gambar yang direferensikan oleh COCO kumpulan data tercantum dalam larik gambar. Setiap objek gambar berisi informasi tentang gambar seperti nama file gambar. Dalam contoh objek gambar berikut, perhatikan informasi berikut dan bidang mana yang diperlukan untuk membuat file manifes Label Kustom Rekognition Amazon.

  • id— (Wajib) Pengidentifikasi unik untuk gambar. idBidang memetakan ke id bidang dalam array anotasi (tempat informasi kotak pembatas disimpan).

  • license— (Tidak Diperlukan) Peta ke array lisensi.

  • coco_url— (Opsional) Lokasi gambar.

  • flickr_url— (Tidak diperlukan) Lokasi gambar di Flickr.

  • width— (Wajib) Lebar gambar.

  • height— (Wajib) Ketinggian gambar.

  • file_name— (Wajib) Nama file gambar. Dalam contoh ini, file_name dan id cocok, tetapi ini bukan persyaratan untuk COCO kumpulan data.

  • date_captured— (Wajib) tanggal dan waktu gambar diambil.

{ "id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/nnnnnnnnnnnnnnnnnnn.jpg", "width": 640, "height": 480, "file_name": "000000245915.jpg", "date_captured": "2013-11-18 02:53:27" }

daftar anotasi (kotak pembatas)

Informasi kotak pembatas untuk semua objek pada semua gambar disimpan daftar anotasi. Objek anotasi tunggal berisi informasi kotak pembatas untuk satu objek dan label objek pada gambar. Ada objek anotasi untuk setiap instance objek pada gambar.

Dalam contoh berikut, perhatikan informasi berikut dan bidang mana yang diperlukan untuk membuat file manifes Label Kustom Rekognition Amazon.

  • id— (Tidak diperlukan) Pengidentifikasi untuk anotasi.

  • image_id— (Wajib) Sesuai dengan gambar id dalam array gambar.

  • category_id— (Wajib) Pengidentifikasi untuk label yang mengidentifikasi objek dalam kotak pembatas. Ini memetakan ke id bidang array kategori.

  • iscrowd— (Tidak diperlukan) Menentukan apakah gambar berisi kerumunan objek.

  • segmentation— (Tidak diperlukan) Informasi segmentasi untuk objek pada gambar. Amazon Rekognition Custom Labels tidak mendukung segmentasi.

  • area— (Tidak diperlukan) Area anotasi.

  • bbox— (Wajib) Berisi koordinat, dalam piksel, dari kotak pembatas di sekitar objek pada gambar.

{ "id": 1409619, "category_id": 1, "iscrowd": 0, "segmentation": [ [86.0, 238.8,..........382.74, 241.17] ], "image_id": 245915, "area": 3556.2197000000015, "bbox": [86, 65, 220, 334] }

daftar kategori

Informasi label disimpan array kategori. Dalam objek kategori contoh berikut, perhatikan informasi berikut dan bidang mana yang diperlukan untuk membuat file manifes Label Kustom Rekognition Amazon.

  • supercategory— (Tidak wajib) Kategori induk untuk label.

  • id— (Wajib) Pengidentifikasi label. idBidang memetakan ke category_id bidang dalam suatu annotation objek. Dalam contoh berikut, Pengidentifikasi untuk titik gema adalah 2.

  • name— (Diperlukan) nama label.

{"supercategory": "speaker","id": 2,"name": "echo dot"}