Permintaan Deteksi Objek dan Format Respons - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Permintaan Deteksi Objek dan Format Respons

Format Permintaan

Kueri model terlatih dengan menggunakan titik akhir model. Titik akhir mengambil format gambar.jpg dan .png dengan dan tipe konten. image/jpeg image/png

Format Respons

Responsnya adalah indeks kelas dengan skor kepercayaan dan koordinat kotak pembatas untuk semua objek dalam gambar yang dikodekan dalam format JSON. Berikut ini adalah contoh dari respon file.json:

{"prediction":[ [4.0, 0.86419455409049988, 0.3088374733924866, 0.07030484080314636, 0.7110607028007507, 0.9345266819000244], [0.0, 0.73376623392105103, 0.5714187026023865, 0.40427327156066895, 0.827075183391571, 0.9712159633636475], [4.0, 0.32643985450267792, 0.3677481412887573, 0.034883320331573486, 0.6318609714508057, 0.5967587828636169], [8.0, 0.22552496790885925, 0.6152569651603699, 0.5722782611846924, 0.882301390171051, 0.8985623121261597], [3.0, 0.42260299175977707, 0.019305512309074402, 0.08386176824569702, 0.39093565940856934, 0.9574796557426453] ]}

Setiap baris dalam file.json ini berisi array yang mewakili objek yang terdeteksi. Masing-masing array objek ini terdiri dari daftar enam angka. Angka pertama adalah label kelas yang diprediksi. Angka kedua adalah skor kepercayaan terkait untuk deteksi. Empat angka terakhir mewakili koordinat kotak pembatas [xmin, ymin, xmax, ymax]. Indeks sudut kotak pembatas keluaran ini dinormalisasi oleh ukuran gambar keseluruhan. Perhatikan bahwa pengkodean ini berbeda dari yang digunakan oleh format input .json. Misalnya, pada entri pertama hasil deteksi, 0,3088374733924866 adalah koordinat kiri (koordinat x sudut kiri atas) dari kotak pembatas sebagai rasio lebar gambar keseluruhan, 0,07030484080314636 adalah koordinat atas (koordinat y dari sudut kiri atas) dari kotak pembatas sebagai rasio tinggi gambar keseluruhan, 0,711070606028007507 adalah koordinat kanan (koordinat x sudut kanan bawah) dari kotak pembatas sebagai rasio lebar gambar keseluruhan, dan 0,9345266819000244 adalah koordinat bawah (koordinat y dari sudut kanan bawah) dari bounding box sebagai rasio tinggi gambar keseluruhan.

Untuk menghindari hasil deteksi yang tidak dapat diandalkan, Anda mungkin ingin menyaring hasil deteksi dengan skor kepercayaan rendah. Dalam buku catatan sampel deteksi objek, kami memberikan contoh skrip yang menggunakan ambang batas untuk menghapus deteksi kepercayaan rendah dan untuk memplot kotak pembatas pada gambar asli.

Untuk transformasi batch, responsnya dalam format JSON, di mana formatnya identik dengan format JSON yang dijelaskan di atas. Hasil deteksi setiap gambar direpresentasikan sebagai file JSON. Sebagai contoh:

{"prediction": [[label_id, confidence_score, xmin, ymin, xmax, ymax], [label_id, confidence_score, xmin, ymin, xmax, ymax]]}

Untuk detail lebih lanjut tentang pelatihan dan inferensi, lihat. Notebook Contoh Deteksi Objek

KELUARAN: Format Respons JSON

terima: aplikasi/json; anotasi = 1

{ "image_size": [ { "width": 500, "height": 400, "depth": 3 } ], "annotations": [ { "class_id": 0, "score": 0.943, "left": 111, "top": 134, "width": 61, "height": 128 }, { "class_id": 0, "score": 0.0013, "left": 161, "top": 250, "width": 79, "height": 143 }, { "class_id": 1, "score": 0.0133, "left": 101, "top": 185, "width": 42, "height": 130 } ] }