Format Permintaan Format Respons KELUARAN: Format Respons JSON

Permintaan Deteksi Objek dan Format Respons

Halaman berikut menjelaskan permintaan inferensi dan format respons untuk MXNet model Deteksi Objek Amazon SageMaker AI.

Format Permintaan

Kueri model terlatih dengan menggunakan titik akhir model. Titik akhir mengambil format gambar.jpg dan .png dengan dan tipe konten. image/jpeg image/png

Format Respons

Responsnya adalah indeks kelas dengan skor kepercayaan dan koordinat kotak pembatas untuk semua objek dalam gambar yang dikodekan dalam format JSON. Berikut ini adalah contoh dari respon file.json:


{"prediction":[
  [4.0, 0.86419455409049988, 0.3088374733924866, 0.07030484080314636, 0.7110607028007507, 0.9345266819000244],
  [0.0, 0.73376623392105103, 0.5714187026023865, 0.40427327156066895, 0.827075183391571, 0.9712159633636475],
  [4.0, 0.32643985450267792, 0.3677481412887573, 0.034883320331573486, 0.6318609714508057, 0.5967587828636169],
  [8.0, 0.22552496790885925, 0.6152569651603699, 0.5722782611846924, 0.882301390171051, 0.8985623121261597],
  [3.0, 0.42260299175977707, 0.019305512309074402, 0.08386176824569702, 0.39093565940856934, 0.9574796557426453]
]}

Setiap baris dalam file.json ini berisi array yang mewakili objek yang terdeteksi. Masing-masing array objek ini terdiri dari daftar enam angka. Angka pertama adalah label kelas yang diprediksi. Angka kedua adalah skor kepercayaan terkait untuk deteksi. Empat angka terakhir mewakili koordinat kotak pembatas [xmin, ymin, xmax, ymax]. Indeks sudut kotak pembatas keluaran ini dinormalisasi oleh ukuran gambar keseluruhan. Perhatikan bahwa pengkodean ini berbeda dari yang digunakan oleh format input .json. Misalnya, pada entri pertama hasil deteksi, 0,3088374733924866 adalah koordinat kiri (koordinat x sudut kiri atas) dari kotak pembatas sebagai rasio lebar gambar keseluruhan, 0,07030484080314636 adalah koordinat atas (koordinat y dari sudut kiri atas) dari kotak pembatas sebagai rasio tinggi gambar keseluruhan, 0,711070606028007507 adalah koordinat kanan (koordinat x sudut kanan bawah) dari kotak pembatas sebagai rasio lebar gambar keseluruhan, dan 0,9345266819000244 adalah koordinat bawah (koordinat y dari sudut kanan bawah) dari bounding box sebagai rasio tinggi gambar keseluruhan.

Untuk menghindari hasil deteksi yang tidak dapat diandalkan, Anda mungkin ingin menyaring hasil deteksi dengan skor kepercayaan rendah. Dalam buku catatan sampel deteksi objek, kami memberikan contoh skrip yang menggunakan ambang batas untuk menghapus deteksi kepercayaan rendah dan untuk memplot kotak pembatas pada gambar asli.

Untuk transformasi batch, responsnya dalam format JSON, di mana formatnya identik dengan format JSON yang dijelaskan di atas. Hasil deteksi setiap gambar direpresentasikan sebagai file JSON. Contoh:


{"prediction": [[label_id, confidence_score, xmin, ymin, xmax, ymax], [label_id, confidence_score, xmin, ymin, xmax, ymax]]}

Untuk detail lebih lanjut tentang pelatihan dan inferensi, lihat. Notebook Contoh Deteksi Objek

KELUARAN: Format Respons JSON

terima: aplikasi/json; anotasi = 1


{
   "image_size": [
      {
         "width": 500,
         "height": 400,
         "depth": 3
      }
   ],
   "annotations": [
      {
         "class_id": 0,
         "score": 0.943,
         "left": 111,
         "top": 134,
         "width": 61,
         "height": 128
      },
      {
         "class_id": 0,
         "score": 0.0013,
         "left": 161,
         "top": 250,
         "width": 79,
         "height": 143
      },
      {
         "class_id": 1,
         "score": 0.0133,
         "left": 101,
         "top": 185,
         "width": 42,
         "height": 130
      }
   ]
}

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Penyetelan Model

Deteksi Objek - TensorFlow