CallAnalyticsJobSettings - Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

CallAnalyticsJobSettings

Menyediakan pengaturan opsional tambahan untukStartCallAnalyticsJob permintaan Anda, termasuk redaksi konten, identifikasi bahasa otomatis; memungkinkan Anda menerapkan model bahasa khusus, filter kosakata khusus, dan kosakata khusus.

Daftar Isi

ContentRedaction

Memungkinkan untuk menyunting atau menandai informasi identitas pribadi tertentu (PII) dalam transkrip Anda. Jika Anda menggunakanContentRedaction, Anda juga harus menyertakan sub-parameter:PiiEntityTypes,RedactionOutput, danRedactionType.

Tipe: Objek ContentRedaction

Wajib: Tidak

LanguageIdSettings

Jika menggunakan identifikasi bahasa otomatis dalam permintaan Anda dan Anda ingin menerapkan model bahasa kustom, kosakata khusus, atau filter kosakata kustom, sertakanLanguageIdSettings dengan sub-parameter yang relevan (VocabularyName,LanguageModelName, danVocabularyFilterName).

LanguageIdSettingsmendukung dua sampai lima kode bahasa. Setiap kode bahasa yang Anda sertakan dapat memiliki model bahasa khusus terkait, kosakata khusus, dan filter kosakata khusus. Kode bahasa yang Anda tentukan harus sesuai dengan bahasa model bahasa kustom terkait, kosakata khusus, dan filter kosakata khusus.

Dianjurkan agar Anda menyertakanLanguageOptions saat menggunakanLanguageIdSettings untuk memastikan bahwa dialek bahasa yang benar diidentifikasi. Misalnya, jika Anda menentukan kosakata khusus yang ada,en-US tetapi Amazon Transcribe menentukan bahwa bahasa yang digunakan di media Andaen-AU, kosakata khusus Anda tidak diterapkan pada transkripsi Anda. Jika Anda menyertakanLanguageOptions dan menyertakanen-US sebagai satu-satunya dialek bahasa Inggris, kosakata khusus Anda diterapkan pada transkripsi Anda.

Jika Anda ingin menyertakan model bahasa khusus, kosakata khusus, atau filter kosakata khusus dengan permintaan Anda tetapi tidak ingin menggunakan identifikasi bahasa otomatis, gunakan sebagai gantinya CallAnalyticsJobSettings parameter denganLanguageModelName,VocabularyName, atauVocabularyFilterName sub-parameter.

Untuk daftar bahasa yang didukung dengan Call Analytics, lihat Bahasa yang didukung dan fitur khusus bahasa.

Tipe: Peta string keLanguageIdSettings objek

Entri Peta: Jumlah maksimum 5 item.

Kunci yang valid: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Wajib: Tidak

LanguageModelName

Nama model bahasa kustom yang ingin Anda gunakan saat memproses pekerjaan Call Analytics Anda. Perhatikan bahwa nama model bahasa besar/kecil.

Bahasa model bahasa kustom yang ditentukan harus sesuai dengan kode bahasa yang Anda tentukan dalam permintaan transkripsi Anda. Jika bahasa tidak cocok, model bahasa kustom tidak diterapkan. Tidak ada kesalahan atau peringatan yang terkait dengan ketidakcocokan bahasa.

Jenis: String

Panjang Batasan: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

Wajib: Tidak

LanguageOptions

Anda dapat menentukan dua atau lebih kode bahasa yang mewakili bahasa yang menurut Anda mungkin ada di media Anda. Termasuk lebih dari lima tidak dianjurkan. Jika Anda tidak yakin bahasa apa yang ada, jangan sertakan parameter ini.

Termasuk opsi bahasa dapat meningkatkan akurasi identifikasi bahasa.

Untuk daftar bahasa yang didukung dengan Call Analytics, lihat tabel Bahasa yang didukung.

Untuk mentranskripsikan pidato dalam Bahasa Arab Standar Modern (ar-SA), file media Anda harus dikodekan dengan kecepatan sampel 16.000 Hz atau lebih tinggi.

Tipe: Array string

Anggota Array: Jumlah minimum 1 item.

Nilai yang Valid: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Wajib: Tidak

VocabularyFilterMethod

Tentukan bagaimana Anda ingin filter kosakata kustom Anda diterapkan pada transkrip Anda.

Untuk mengganti kata-kata dengan***, pilihmask.

Untuk menghapus kata, pilihremove.

Untuk menandai kata-kata tanpa mengubahnya, pilihtag.

Jenis: String

Nilai yang Valid: remove | mask | tag

Wajib: Tidak

VocabularyFilterName

Nama filter kosakata khusus yang ingin Anda sertakan dalam permintaan transkripsi Analytics Panggilan Anda. Nama filter kosakata khusus huruf besar/kecil.

Perhatikan bahwa jika Anda menyertakanVocabularyFilterName dalam permintaan Anda, Anda juga harus menyertakannyaVocabularyFilterMethod.

Jenis: String

Panjang Batasan: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

Wajib: Tidak

VocabularyName

Nama kosakata khusus yang ingin Anda sertakan dalam permintaan transkripsi Analytics Panggilan Anda. Nama kosakata khusus huruf besar/kecil.

Jenis: String

Panjang Batasan: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

Diperlukan: Tidak

Lihat Juga

Untuk informasi selengkapnya tentang penggunaan API di salah satuAWS SDK khusus bahasa, lihat yang berikut ini: