Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Meningkatkan model Label Kustom Rekognition Amazon
Kinerja model pembelajaran mesin sangat tergantung pada faktor-faktor seperti kompleksitas dan variabilitas label khusus Anda (objek dan adegan spesifik yang Anda minati), kualitas dan kekuatan representatif dari kumpulan data pelatihan yang Anda berikan, dan kerangka kerja model dan metode pembelajaran mesin yang digunakan untuk melatih model.
Amazon Rekognition Custom Labels, membuat proses ini lebih sederhana, dan tidak diperlukan keahlian pembelajaran mesin. Namun, proses membangun model yang baik sering melibatkan iterasi atas data dan perbaikan model untuk mencapai kinerja yang diinginkan. Berikut ini adalah informasi tentang cara meningkatkan model Anda.
Data
Secara umum, Anda dapat meningkatkan kualitas model Anda dengan jumlah data berkualitas lebih baik yang lebih besar. Gunakan gambar pelatihan yang menunjukkan objek atau pemandangan dengan jelas dan tidak berantakan dengan item yang tidak dibutuhkan. Untuk membatasi kotak di sekitar objek, gunakan gambar pelatihan yang menunjukkan objek sepenuhnya terlihat dan tidak tersumbat oleh objek lain.
Pastikan bahwa kumpulan data pelatihan dan pengujian Anda cocok dengan jenis gambar yang pada akhirnya akan Anda jalankan inferensi. Untuk objek, seperti logo, di mana Anda hanya memiliki beberapa contoh pelatihan, Anda harus menyediakan kotak pembatas di sekitar logo dalam gambar pengujian Anda. Gambar-gambar ini mewakili atau menggambarkan skenario di mana Anda ingin melokalisasi objek.
Untuk menambahkan lebih banyak gambar ke kumpulan data pelatihan atau pengujian, lihatMenambahkan lebih banyak gambar ke dataset.
Mengurangi positif palsu (presisi yang lebih baik)
-
Pertama, periksa apakah meningkatkan ambang batas yang diasumsikan memungkinkan Anda menyimpan prediksi yang benar, sambil mengurangi positif palsu. Pada titik tertentu, ini memiliki keuntungan yang berkurang karena trade-off antara presisi dan penarikan untuk model tertentu. Anda tidak dapat mengatur ambang batas yang diasumsikan untuk label, tetapi Anda dapat mencapai hasil yang sama dengan menentukan nilai tinggi untuk
DetectCustomLabels
parameterMinConfidence
input. Untuk informasi selengkapnya, lihat Menganalisis gambar dengan model terlatih. -
Anda mungkin melihat satu atau lebih label khusus yang Anda minati (A) secara konsisten bingung dengan kelas objek yang sama (tetapi bukan label yang Anda minati) (B). Untuk membantu, tambahkan B sebagai label kelas objek ke kumpulan data pelatihan Anda (bersama dengan gambar yang Anda dapatkan positif palsu). Secara efektif, Anda membantu model belajar memprediksi B dan bukan A melalui gambar pelatihan baru. Untuk menambahkan gambar ke kumpulan data pelatihan, lihatMenambahkan lebih banyak gambar ke dataset.
-
Anda mungkin menemukan bahwa model dikacaukan oleh dua label khusus Anda (A dan B) —gambar uji dengan label A diprediksi memiliki label B dan sebaliknya. Dalam hal ini, pertama-tama periksa gambar yang salah label di set pelatihan dan tes Anda. Gunakan galeri kumpulan data untuk mengelola label yang ditetapkan ke kumpulan data. Untuk informasi selengkapnya, lihat Mengelola label. Selain itu, menambahkan lebih banyak gambar pelatihan yang terkait dengan jenis kebingungan ini akan membantu model yang dilatih ulang membedakan antara A dan B. Untuk menambahkan gambar ke kumpulan data pelatihan, lihat. Menambahkan lebih banyak gambar ke dataset
Mengurangi negatif palsu (mengingat lebih baik)
-
Gunakan nilai yang lebih rendah untuk ambang batas yang diasumsikan. Anda tidak dapat mengatur ambang batas yang diasumsikan untuk label, tetapi Anda dapat mencapai hasil yang sama dengan menentukan parameter
MinConfidence
input yang lebih rendah.DetectCustomLabels
Untuk informasi selengkapnya, lihat Menganalisis gambar dengan model terlatih. -
Gunakan contoh yang lebih baik untuk memodelkan variasi objek dan gambar di mana mereka muncul.
-
Pisahkan label Anda menjadi dua kelas yang lebih mudah dipelajari. Misalnya, alih-alih cookie yang baik dan cookie yang buruk, Anda mungkin menginginkan cookie yang baik, cookie yang dibakar, dan cookie yang rusak untuk membantu model mempelajari setiap konsep unik dengan lebih baik.