Mempersiapkan kumpulan data Anda - Amazon Rekognition

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mempersiapkan kumpulan data Anda

Membuat adaptor mengharuskan Anda menyediakan Rekognition dengan dua kumpulan data, kumpulan data pelatihan, dan kumpulan data pengujian. Setiap dataset terdiri dari menyediakan dua elemen: gambar dan anotasi/label. Bagian berikut menjelaskan label dan gambar apa yang digunakan dan bagaimana mereka bersatu untuk membuat kumpulan data.

Citra

Anda perlu melatih adaptor pada sampel representatif gambar Anda. Saat Anda memilih gambar untuk pelatihan, cobalah untuk menyertakan setidaknya beberapa gambar yang menunjukkan respons yang diharapkan untuk setiap label yang Anda targetkan dengan adaptor Anda.

Untuk membuat kumpulan data pelatihan, Anda perlu menyediakan salah satu dari dua jenis gambar berikut:

  • Gambar dengan prediksi Positif Palsu. Misalnya, ketika model dasar memprediksi bahwa gambar mengandung alkohol, tetapi ternyata tidak.

  • Gambar dengan prediksi Negatif Palsu. Misalnya, ketika model dasar memprediksi bahwa gambar tidak mengandung alkohol, tetapi memang demikian.

Untuk membuat kumpulan data yang seimbang, Anda disarankan untuk menyediakan salah satu dari dua jenis gambar berikut:

  • Gambar dengan prediksi Positif Sejati. Misalnya, ketika model dasar memprediksi dengan benar bahwa suatu gambar mengandung alkohol. Disarankan untuk memberikan gambar-gambar ini jika Anda memberikan gambar Positif Palsu.

  • Gambar dengan prediksi Negatif Sejati. Misalnya, ketika model dasar memprediksi dengan benar bahwa gambar tidak mengandung alkohol. Disarankan untuk memberikan gambar-gambar ini jika Anda memberikan gambar Negatif Palsu.

Label

Label mengacu pada salah satu dari yang berikut: objek, peristiwa, konsep atau kegiatan. Untuk Moderasi Konten, label adalah contoh konten yang tidak pantas, tidak diinginkan, atau menyinggung.

Dalam konteks membuat adaptor dengan melatih model dasar Rekognition, ketika label ditetapkan ke gambar, itu disebut anotasi. Saat melatih adaptor dengan Konsol Rekognition, Anda akan menggunakan Konsol untuk menambahkan anotasi ke gambar Anda dengan memilih label dan kemudian menandai gambar yang sesuai dengan label. Melalui proses ini, model belajar mengidentifikasi elemen gambar Anda berdasarkan label yang ditetapkan. Proses penautan ini memungkinkan model untuk fokus pada konten yang paling relevan saat adaptor dibuat, yang mengarah pada peningkatan akurasi untuk analisis gambar.

Atau, Anda dapat menyediakan file manifes, yang berisi informasi tentang gambar dan anotasi yang menyertainya.

Kumpulan data pelatihan dan pengujian

Dataset pelatihan adalah dasar untuk menyempurnakan model dan membuat adaptor khusus. Anda harus menyediakan kumpulan data pelatihan beranotasi agar model dapat dipelajari. Model belajar dari kumpulan data ini untuk meningkatkan kinerjanya pada jenis gambar yang Anda berikan.

Untuk meningkatkan akurasi, Anda harus membuat kumpulan data pelatihan berdasarkan annotation/labeling gambar. Anda dapat melakukan ini menggunakan dua cara:

  • Penetapan label manual - Anda dapat menggunakan Konsol Rekognition untuk membuat kumpulan data pelatihan dengan mengunggah gambar yang ingin berisi kumpulan data Anda dan kemudian menetapkan label secara manual ke gambar ini.

  • File manifes - Anda dapat menggunakan file manifes untuk melatih adaptor Anda. File manifes berisi informasi tentang anotasi kebenaran dasar untuk gambar pelatihan dan pengujian Anda, serta lokasi gambar pelatihan Anda. Anda dapat memberikan file manifes saat melatih adaptor menggunakan APIs Rekognition atau saat menggunakan Konsol. AWS

Dataset pengujian digunakan untuk mengevaluasi kinerja adaptor setelah pelatihan. Untuk memastikan evaluasi yang andal, kumpulan data pengujian dibuat dengan menggunakan sepotong kumpulan data pelatihan asli yang belum pernah dilihat model sebelumnya. Proses ini memastikan bahwa kinerja adaptor dinilai dengan data baru, menciptakan pengukuran dan metrik yang akurat. Untuk peningkatan akurasi yang optimal, lihatPraktik terbaik untuk adaptor pelatihan.