語音速度 - Amazon Polly

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

語音速度

由於聲音之間的自然變化,每個可用的聲音以略有不同的速度說話。例如,在美國英語的聲音中,常春藤和喬安娜比馬修略快,並且比喬伊快得多。由於語音之間有很多變化,因此 Amazon Polly 聲音沒有標準速度(每分鐘單詞數)可用。但是,您可以找到使用語音標記使用語音標記說出所選文本需要多長時間。

為了計算口頭文本段落的長度
  1. 開啟 AWS CLI.

  2. 運行以下代碼,根據需要填寫。

    aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt
  3. 打開 LengthOfText.txt.

如果文本是「瑪麗有一隻小羊肉」,Amazon Polly 返回的最後幾行將是:

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

基本上,最後視素即「lamb」中最後字母發音,是在開始說話後 1082 毫秒處開始。雖然這並非音訊確實的長度,但是已經很接近,可做為語音比較的基礎。

變更您的語音速度

對於特定的應用程式,您可能會發現您希望語音放慢或加快。如果問題是語音的速度,Amazon Polly 提供使用 SSML 標籤修改此功能的功能。例如,如果您的組織正在向移民受眾提出閱讀書籍的應用程序,則可能需要改變語音速度。您的聽眾可能會說英語,但他們的流利程度有限。<prosody>Amazon Polly 可協助您使用 SSML 標籤減慢語音速度。

您可以使用百分比:

<speak> In some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

或預設速度:

<speak> In some cases, it might help your audience to <prosody rate="slow">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

將 SSML 與 Amazon Polly 搭配使用時,您可以使用兩種速度選項:

  • 預設速度:x-slowslowmediumfast、和x-fast。在這些情況下,每個選項是大約的速度,其取決於您慣用的語音。medium 選項是正常的語音速度。

  • 語速的 n%:可以使用 20% 到 200% 之間的語速率的任何百分比。在這些情況下,您可以選擇完全符合所需的速度。但是,語音的實際速度是近似的,具體取決於您選擇的聲音。100% 被認為是語音的正常速度。

注意

以各種速度測試您選擇的聲音。每個選項的速度都是近似值,取決於您選擇的聲音。

如需使用prosody標籤的詳細資訊,請參閱控制音量、朗讀速度和音高