daftar gambar daftar anotasi (kotak pembatas)daftar kategori

Format dataset COCO

Dataset COCO terdiri dari lima bagian informasi yang memberikan informasi untuk seluruh kumpulan data. Format untuk kumpulan data deteksi objek COCO didokumentasikan di Format Data COCO.

info — informasi umum tentang dataset.
lisensi — informasi lisensi untuk gambar dalam dataset.
images — daftar gambar dalam dataset.
anotasi — daftar anotasi (termasuk kotak pembatas) yang ada di semua gambar dalam kumpulan data.
kategori — daftar kategori label.

Untuk membuat manifes Label Kustom, Anda menggunakanimages,annotations, dan categories daftar dari file manifes COCO. Bagian lain (info,licences) tidak diperlukan. Berikut ini adalah contoh file manifes COCO.


{
    "info": {
        "description": "COCO 2017 Dataset","url": "http://cocodataset.org","version": "1.0","year": 2017,"contributor": "COCO Consortium","date_created": "2017/09/01"
    },
    "licenses": [
        {"url": "http://creativecommons.org/licenses/by/2.0/","id": 4,"name": "Attribution License"}
    ],
    "images": [
        {"id": 242287, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/xxxxxxxxxxxx.jpg", "flickr_url": "http://farm3.staticflickr.com/2626/xxxxxxxxxxxx.jpg", "width": 426, "height": 640, "file_name": "xxxxxxxxx.jpg", "date_captured": "2013-11-15 02:41:42"},
        {"id": 245915, "license": 4, "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg", "flickr_url": "http://farm1.staticflickr.com/88/xxxxxxxxxxxx.jpg", "width": 640, "height": 480, "file_name": "nnnnnnnnnn.jpg", "date_captured": "2013-11-18 02:53:27"}
    ],
    "annotations": [
        {"id": 125686, "category_id": 0, "iscrowd": 0, "segmentation": [[164.81, 417.51,......167.55, 410.64]], "image_id": 242287, "area": 42061.80340000001, "bbox": [19.23, 383.18, 314.5, 244.46]},
        {"id": 1409619, "category_id": 0, "iscrowd": 0, "segmentation": [[376.81, 238.8,........382.74, 241.17]], "image_id": 245915, "area": 3556.2197000000015, "bbox": [399, 251, 155, 101]},
        {"id": 1410165, "category_id": 1, "iscrowd": 0, "segmentation": [[486.34, 239.01,..........495.95, 244.39]], "image_id": 245915, "area": 1775.8932499999994, "bbox": [86, 65, 220, 334]}
    ],
    "categories": [
        {"supercategory": "speaker","id": 0,"name": "echo"},
        {"supercategory": "speaker","id": 1,"name": "echo dot"}
    ]
}

daftar gambar

Gambar yang direferensikan oleh dataset COCO tercantum dalam larik gambar. Setiap objek gambar berisi informasi tentang gambar seperti nama file gambar. Dalam contoh objek gambar berikut, perhatikan informasi berikut dan bidang mana yang diperlukan untuk membuat file manifes Label Kustom Rekognition Amazon.

id— (Wajib) Pengidentifikasi unik untuk gambar. idBidang memetakan ke id bidang dalam array anotasi (tempat informasi kotak pembatas disimpan).
license— (Tidak Diperlukan) Peta ke array lisensi.
coco_url— (Opsional) Lokasi gambar.
flickr_url— (Tidak diperlukan) Lokasi gambar di Flickr.
width— (Wajib) Lebar gambar.
height— (Wajib) Ketinggian gambar.
file_name— (Wajib) Nama file gambar. Dalam contoh ini, file_name dan id cocok, tetapi ini bukan persyaratan untuk kumpulan data COCO.
date_captured— (Wajib) tanggal dan waktu gambar diambil.


{
    "id": 245915,
    "license": 4,
    "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg",
    "flickr_url": "http://farm1.staticflickr.com/88/nnnnnnnnnnnnnnnnnnn.jpg",
    "width": 640,
    "height": 480,
    "file_name": "000000245915.jpg",
    "date_captured": "2013-11-18 02:53:27"
}

daftar anotasi (kotak pembatas)

Informasi kotak pembatas untuk semua objek pada semua gambar disimpan daftar anotasi. Objek anotasi tunggal berisi informasi kotak pembatas untuk satu objek dan label objek pada gambar. Ada objek anotasi untuk setiap instance objek pada gambar.

Dalam contoh berikut, perhatikan informasi berikut dan bidang mana yang diperlukan untuk membuat file manifes Label Kustom Rekognition Amazon.

id— (Tidak diperlukan) Pengidentifikasi untuk anotasi.
image_id— (Wajib) Sesuai dengan gambar id dalam array gambar.
category_id— (Wajib) Pengidentifikasi untuk label yang mengidentifikasi objek dalam kotak pembatas. Ini memetakan ke id bidang array kategori.
iscrowd— (Tidak diperlukan) Menentukan apakah gambar berisi kerumunan objek.
segmentation— (Tidak diperlukan) Informasi segmentasi untuk objek pada gambar. Amazon Rekognition Custom Labels tidak mendukung segmentasi.
area— (Tidak diperlukan) Area anotasi.
bbox— (Wajib) Berisi koordinat, dalam piksel, dari kotak pembatas di sekitar objek pada gambar.


{
    "id": 1409619,
    "category_id": 1,
    "iscrowd": 0,
    "segmentation": [
        [86.0, 238.8,..........382.74, 241.17]
    ],
    "image_id": 245915,
    "area": 3556.2197000000015,
    "bbox": [86, 65, 220, 334]
}

daftar kategori

Informasi label disimpan array kategori. Dalam objek kategori contoh berikut, perhatikan informasi berikut dan bidang mana yang diperlukan untuk membuat file manifes Label Kustom Rekognition Amazon.

supercategory— (Tidak wajib) Kategori induk untuk label.
id— (Wajib) Pengidentifikasi label. idBidang memetakan ke category_id bidang dalam suatu annotation objek. Dalam contoh berikut, Pengidentifikasi untuk titik gema adalah 2.
name— (Diperlukan) nama label.



        {"supercategory": "speaker","id": 2,"name": "echo dot"}

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Mengubah dataset COCO menjadi format file manifes

Mengubah dataset COCO