Lokalisasi objek dalam file manifes - Rekognition

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Lokalisasi objek dalam file manifes

Anda dapat mengimpor gambar berlabel dengan informasi pelokalan objek dengan menambahkan SageMaker Ground Truth Bounding Box Job Output format baris JSON ke file manifes.

Informasi lokalisasi mewakili lokasi objek pada gambar. Lokasi diwakili oleh kotak pembatas yang mengelilingi objek. Struktur kotak pembatas berisi koordinat kiri atas kotak pembatas dan lebar dan tinggi kotak pembatas. Garis JSON format kotak pembatas mencakup kotak pembatas untuk lokasi satu atau lebih objek pada gambar dan kelas setiap objek pada gambar.

File manifes terbuat dari satu atau lebih baris JSON, setiap baris berisi informasi untuk satu gambar.

Untuk membuat file manifes untuk lokalisasi objek
  1. Buat file teks kosong.

  2. Tambahkan baris JSON untuk setiap gambar yang ingin Anda impor. Setiap baris JSON akan terlihat mirip dengan yang berikut ini.

    {"source-ref": "s3://bucket/images/IMG_1186.png", "bounding-box": {"image_size": [{"width": 640, "height": 480, "depth": 3}], "annotations": [{ "class_id": 1, "top": 251, "left": 399, "width": 155, "height": 101}, {"class_id": 0, "top": 65, "left": 86, "width": 220, "height": 334}]}, "bounding-box-metadata": {"objects": [{ "confidence": 1}, {"confidence": 1}], "class-map": {"0": "Echo", "1": "Echo Dot"}, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2013-11-18T02:53:27", "job-name": "my job"}}
  3. Simpan file tersebut. Anda dapat menggunakan ekstensi.manifest, tetapi tidak diperlukan.

  4. Buat kumpulan data menggunakan file yang baru saja Anda buat. Untuk informasi selengkapnya, lihat Untuk membuat kumpulan data menggunakan file manifes format SageMaker Ground Truth (konsol).

Objek pembatas kotak garis JSON

Di bagian ini, kami menunjukkan cara membuat garis JSON untuk satu gambar. Gambar berikut menunjukkan kotak pembatas di sekitar perangkat Amazon Echo dan Amazon Echo Dot.

Berikut ini adalah garis JSON kotak pembatas untuk gambar sebelumnya.

{ "source-ref": "s3://custom-labels-bucket/images/IMG_1186.png", "bounding-box": { "image_size": [{ "width": 640, "height": 480, "depth": 3 }], "annotations": [{ "class_id": 1, "top": 251, "left": 399, "width": 155, "height": 101 }, { "class_id": 0, "top": 65, "left": 86, "width": 220, "height": 334 }] }, "bounding-box-metadata": { "objects": [{ "confidence": 1 }, { "confidence": 1 }], "class-map": { "0": "Echo", "1": "Echo Dot" }, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2013-11-18T02:53:27", "job-name": "my job" } }

Perhatikan informasi berikut.

sumber-ref

(Wajib) Lokasi Amazon S3 dari gambar. Formatnya adalah "s3://BUCKET/OBJECT_PATH". Gambar dalam kumpulan data yang diimpor harus disimpan dalam bucket Amazon S3 yang sama.

kotak pembatas

(Wajib) Atribut label. Anda memilih nama bidang. Berisi ukuran gambar dan kotak pembatas untuk setiap objek yang terdeteksi dalam gambar. Harus ada metadata terkait yang diidentifikasi dengan nama bidang dengan -metadata ditambahkan. Misalnya, "bounding-box-metadata".

image_size

(Wajib) Sebuah array elemen tunggal yang berisi ukuran gambar dalam piksel.

  • tinggi - (Wajib) Ketinggian gambar dalam piksel.

  • lebar - (Wajib) Kedalaman gambar dalam piksel.

  • kedalaman — (Wajib) Jumlah saluran dalam gambar. Untuk gambar RGB, nilainya adalah 3. Saat ini tidak digunakan oleh Amazon Rekognition Custom Labels, tetapi nilai diperlukan.

anotasi

(Wajib) Sebuah array informasi kotak pembatas untuk setiap objek yang terdeteksi dalam gambar.

  • class_id — (Wajib) Memetakan ke label di peta kelas. Pada contoh sebelumnya, objek dengan class_id dari 1 adalah Echo Dot pada gambar.

  • atas — (Wajib) Jarak dari atas gambar ke bagian atas kotak pembatas, dalam piksel.

  • kiri - (Wajib) Jarak dari kiri gambar ke kiri kotak pembatas, dalam piksel.

  • lebar - (Wajib) Lebar kotak pembatas, dalam piksel.

  • tinggi - (Wajib) Ketinggian kotak pembatas, dalam piksel.

kotak pembatas -metadata

(Wajib) Metadata tentang atribut label. Nama bidang harus sama dengan atribut label dengan -metadata ditambahkan. Array informasi kotak pembatas untuk setiap objek yang terdeteksi dalam gambar.

Objek

(Wajib) Sebuah array objek yang ada dalam gambar. Memetakan ke array anotasi berdasarkan indeks. Atribut confidence tidak digunakan oleh Amazon Rekognition Custom Labels.

peta kelas

(Wajib) Peta kelas yang berlaku untuk objek yang terdeteksi dalam gambar.

jenis

(Wajib) Jenis pekerjaan klasifikasi. "groundtruth/object-detection"mengidentifikasi pekerjaan sebagai deteksi objek.

kreasi-tanggal

(Wajib) Tanggal dan waktu Universal Terkoordinasi (UTC) saat label dibuat.

beranotasi manusia

(Wajib) Tentukan"yes", jika anotasi diselesaikan oleh manusia. Jika tidak"no".

nama-pekerjaan

(Opsional) Nama pekerjaan yang memproses gambar.