Pelabelan - AWS Bimbingan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pelabelan

Berikan instruksi pelabelan yang jelas

Kumpulan data mungkin menyertakan sampel ambigu yang menghasilkan pelabelan yang tidak konsisten di seluruh kumpulan data. Misalnya, pertimbangkan tugas memberi label pada gambar yang berisi kucing. Beberapa sampel mungkin hanya berisi sekilas hewan. Haruskah mereka ditandai dengan label positif atau negatif? Jenis masalah ini dapat diselesaikan dengan memberikan instruksi yang jelas dan obyektif kepada pelabel.

Gunakan suara mayoritas

Sekarang pertimbangkan masalah pelabelan speech-to-text kumpulan data yang berisi audio berisik dengan kata-kata yang secara fonetis mirip atau identik dengan yang lain, seperti know and go, shoe and two, cry and high, atau right and write. Dalam hal ini, pelabel mungkin memberi label sampel ini secara tidak konsisten.

Untuk mempertahankan tingkat kebenaran yang tinggi dalam pelabelan, pendekatan umum adalah dengan menggunakan pemungutan suara mayoritas, di mana sampel data yang sama diberikan kepada banyak pekerja dan hasilnya dikumpulkan. Metode ini dan variasinya yang lebih canggih dijelaskan dalam posting blog Gunakan kebijaksanaan orang banyak dengan Amazon SageMaker Ground Truth untuk membubuhi keterangan data lebih akurat di blog AWS Machine Learning.