Kecepatan suara - Amazon Polly

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kecepatan suara

Karena variasi alami antara suara, setiap suara yang tersedia berbicara dengan kecepatan yang sedikit berbeda. Misalnya, dengan suara Inggris AS, Ivy dan Joanna sedikit lebih cepat daripada Matthew, dan jauh lebih cepat daripada Joey. Karena ada begitu banyak variasi antara suara, tidak ada kecepatan standar (kata per menit) yang tersedia untuk suara Amazon Polly. Namun, Anda dapat menemukan berapa lama waktu yang dibutuhkan suara Anda untuk mengucapkan teks yang dipilih menggunakan Tanda Pidato.

Untuk mengatur waktu panjang bagian teks yang diucapkan
  1. Buka AWS CLI.

  2. Jalankan kode berikut, isi sesuai kebutuhan.

    aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt
  3. Buka LengthOfText.txt.

Jika teksnya adalah “Mary have a little lamb,” beberapa baris terakhir yang dikembalikan oleh Amazon Polly adalah:

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

Viseme terakhir, pada dasarnya suara untuk huruf terakhir dalam “domba” dimulai 1082 milidetik setelah awal pidato. Meskipun ini tidak persis panjang audio, itu dekat dan dapat berfungsi sebagai dasar untuk perbandingan antara suara.

Mengubah kecepatan suara Anda

Untuk aplikasi tertentu, Anda mungkin menemukan bahwa Anda lebih suka suara yang Anda suka diperlambat, atau dipercepat. Jika kecepatan suara menjadi perhatian, Amazon Polly menyediakan kemampuan untuk memodifikasi ini menggunakan tag SSML. Misalnya, jika organisasi Anda membuat aplikasi yang membaca buku untuk audiens imigran, Anda mungkin ingin memvariasikan kecepatan suara. Audiens Anda mungkin berbicara bahasa Inggris, tetapi kefasihan mereka terbatas. <prosody>Amazon Polly membantu Anda memperlambat laju bicara menggunakan tag SSML.

Anda dapat menggunakan persentase:

<speak> In some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

Atau kecepatan preset:

<speak> In some cases, it might help your audience to <prosody rate="slow">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

Dua opsi kecepatan tersedia untuk Anda saat menggunakan SSML dengan Amazon Polly:

  • Kecepatan preset:x-slow,,slow, mediumfast, danx-fast. Dalam kasus ini, kecepatan setiap opsi adalah perkiraan, tergantung pada suara pilihan Anda. mediumPilihannya adalah kecepatan normal suara.

  • n% dari tingkat bicara: setiap persentase dari tingkat bicara, antara 20% dan 200% dapat digunakan. Dalam kasus ini, Anda dapat memilih kecepatan yang Anda inginkan. Namun, kecepatan suara yang sebenarnya adalah perkiraan, tergantung pada suara yang Anda pilih. 100% dianggap sebagai kecepatan normal suara.

catatan

Uji suara yang Anda pilih dengan berbagai kecepatan. Kecepatan setiap opsi adalah perkiraan dan tergantung pada suara yang Anda pilih.

Untuk informasi selengkapnya tentang penggunaan prosody tag, lihatMengontrol volume, kecepatan berbicara, dan nada .