Mendeteksi ucapan beracun - Amazon Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mendeteksi ucapan beracun

Deteksi ucapan beracun dirancang untuk membantu memoderasi platform media sosial yang melibatkanpeer-to-peerdialog, seperti game online dan platform obrolan sosial. Penggunaan ucapan beracun dapat sangat merugikan individu, kelompok sebaya, dan komunitas. Menandai bahasa berbahaya membantu organisasi menjaga percakapan tetap sipil dan menjaga lingkungan online yang aman dan inklusif bagi pengguna untuk membuat, berbagi, dan berpartisipasi secara bebas.

Amazon TranscribeDeteksi Toksisitas memanfaatkan isyarat berbasis audio dan teks untuk mengidentifikasi dan mengklasifikasikan konten beracun berbasis suara di tujuh kategori termasuk pelecehan seksual, ucapan kebencian, ancaman, pelecehan, kata-kata kotor, penghinaan, dan grafik. Selain teks,Amazon TranscribeDeteksi Toksisitas menggunakan isyarat bicara, seperti nada dan nada untuk mengasah niat beracun dalam pidato. Ini adalah peningkatan dari sistem moderasi konten standar yang dirancang untuk fokus hanya pada istilah tertentu, tanpa memperhitungkan niat.

Amazon Transcribebendera dan mengkategorikan ucapan beracun, yang meminimalkan volume data yang harus diproses secara manual. Hal ini memungkinkan moderator konten untuk mengelola wacana di platform mereka dengan cepat dan efisien.

Kategori ucapan beracun meliputi:

  • Kata-kata senonoh: Ucapan yang berisi kata, frasa, atau akronim yang tidak sopan, vulgar, atau menyinggung.

  • Pidato kebencian: Pidato yang mengkritik, menghina, mencela, atau tidak manusiawi seseorang atau kelompok berdasarkan identitas (seperti ras, etnis, jenis kelamin, agama, orientasi seksual, kemampuan, dan asal negara).

  • Seksual: Ucapan yang menunjukkan minat seksual, aktivitas, atau gairah menggunakan referensi langsung atau tidak langsung ke bagian tubuh, sifat fisik, atau seks.

  • Penghinaan: Ucapan yang mencakup merendahkan, memalukan, mengejek, menghina, atau meremehkan bahasa. Jenis bahasa ini juga diberi label sebagai intimidasi.

  • Kekerasan atau ancaman: Ucapan yang mencakup ancaman yang ingin menimbulkan rasa sakit, cedera, atau permusuhan terhadap seseorang atau kelompok.

  • Grafis: Pidato yang menggunakan citra deskriptif visual dan tidak menyenangkan. Jenis bahasa ini sering sengaja bertele-tele untuk memperkuat ketidaknyamanan penerima.

  • Pelecehan atau kasar: Pidato dimaksudkan untuk mempengaruhi kesejahteraan psikologis penerima, termasuk istilah merendahkan dan objektifikasi. Jenis bahasa ini juga diberi label sebagai pelecehan.

Deteksi toksisitas menganalisis segmen ucapan (pidato antara jeda alami) dan memberikan skor kepercayaan pada segmen ini. Skor kepercayaan adalah nilai antara 0 dan 1. Skor kepercayaan yang lebih besar menunjukkan kemungkinan lebih besar bahwa konten tersebut adalah ucapan beracun dalam kategori terkait. Anda dapat menggunakan skor kepercayaan ini untuk menetapkan ambang deteksi toksisitas yang sesuai untuk kasus penggunaan Anda.

catatan

Deteksi toksisitas hanya tersedia untuk transkripsi batch dalam bahasa Inggris AS(en-US).

Lihatcontoh keluarandalam format JSON.