Kosakata khusus - Amazon Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kosakata khusus

Gunakan kosakata khusus untuk meningkatkan akurasi transkripsi untuk satu atau lebih kata tertentu. Ini umumnya istilah khusus domain, seperti nama merek dan akronim, kata benda yang tepat, dan kata-kata yang tidak ditampilkan dengan benar. Amazon Transcribe

Kosakata khusus dapat digunakan dengan semua bahasa yang didukung. Perhatikan bahwa hanya karakter yang tercantum dalam kumpulan karakter bahasa Anda yang dapat digunakan dalam kosakata khusus.

penting

Anda bertanggung jawab atas integritas data Anda sendiri saat Anda menggunakannya Amazon Transcribe. Jangan memasukkan informasi rahasia, informasi pribadi (PII), atau informasi kesehatan yang dilindungi (PHI) ke dalam kosakata khusus.

Pertimbangan saat membuat kosakata khusus:

  • Anda dapat memiliki hingga 100 file kosakata khusus per Akun AWS

  • Batas ukuran untuk setiap file kosakata kustom adalah 50 Kb

  • Jika menggunakan API untuk membuat kosakata kustom Anda, file kosakata Anda harus dalam format teks (*.txt). Jika menggunakan AWS Management Console, file kosakata Anda dapat dalam format teks (*.txt) atau format nilai dipisahkan koma (*.csv).

  • Setiap entri dalam kosakata kustom tidak boleh melebihi 256 karakter

  • Untuk menggunakan kosakata khusus, itu harus dibuat Wilayah AWS sama dengan transkripsi Anda.

Tip

Anda dapat menguji kosakata khusus Anda menggunakan. AWS Management Console Setelah kosakata kustom Anda siap digunakan, masuk ke, pilih Transkripsi waktu nyata AWS Management Console, gulir ke Kustomisasi, aktifkan kosakata khusus, dan pilih kosakata khusus Anda dari daftar tarik-turun. Kemudian pilih mulai streaming. Ucapkan beberapa kata dalam kosakata khusus Anda ke mikrofon Anda untuk melihat apakah kata-kata tersebut ditampilkan dengan benar.

Tabel kosakata khusus versus daftar

penting

Kosakata kustom dalam format daftar tidak digunakan lagi. Jika Anda membuat kosakata kustom baru, gunakan format tabel.

Tabel memberi Anda lebih banyak pilihan untuk — dan lebih banyak kontrol atas — input dan output kata dalam kosakata khusus Anda. Dengan tabel, Anda harus menentukan beberapa kategori(Phrase and DisplayAs), memungkinkan Anda untuk menyempurnakan output Anda.

Daftar tidak memiliki opsi tambahan, jadi Anda hanya dapat mengetikkan entri seperti yang Anda inginkan untuk muncul di transkrip Anda, menggantikan semua spasi dengan tanda hubung.

The AWS Management Console, AWS CLI, dan AWS SDK semuanya menggunakan tabel kosakata kustom dengan cara yang sama; daftar digunakan secara berbeda untuk setiap metode dan dengan demikian mungkin memerlukan pemformatan tambahan untuk keberhasilan penggunaan antar metode.

Untuk informasi selengkapnya, lihat Membuat kosakata khusus menggunakan tabel dan Membuat kosakata khusus menggunakan daftar.

Untuk menyelam lebih dalam dan mempelajari cara menggunakan Amazon Augmented AI dengan kosakata khusus, lihat: