语音速度 - Amazon Polly

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

语音速度

由于声音之间的自然差异,每个可用声音的说话速度都略有不同。例如,在美式英语配音中,Ivy 和 Joanna 的速度比 Matthew 稍快一点,也比 Joey 快得多。由于语音之间的差异很大,因此没有可用于 Amazon Polly 语音的标准速度(每分钟字数)。但是,你可以使用语音标记找到你的声音需要多长时间才能说出所选文本。

计时口语文本段落的长度
  1. 打开 AWS CLI.

  2. 运行以下代码,根据需要填写。

    aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt
  3. 打开 LengthOfText.txt

如果文本为“Mary had a little lamb”,则 Amazon Polly 返回的最后几行将为:

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

最后一个 viseme(本质上是“lamb”的最后几个字母的读音)在语音开始后 1082 毫秒开始。虽然这不是音频的准确长度,但很接近,可用作比较语音的基础。

更改您的语音速度

对于某些应用程序,您可能会发现,您更希望放慢或加快您喜欢的语音。如果需要考虑语音速度,Amazon Polly 会提供使用 SSML 标签进行修改的能力。例如,如果您的组织正在开发一款向移民受众阅读书籍的应用程序,则可能需要调整语音速度。您的听众可能会说英语,但他们的流利程度有限。<prosody>Amazon Polly 使用 SSML 标签帮助你减慢语速。

你可以使用百分比:

<speak> In some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

或者预设速度:

<speak> In some cases, it might help your audience to <prosody rate="slow">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

在将 SSML 与 Amazon Polly 结合使用时,您可使用两个速度选项:

  • 预设速度:x-slowslowmediumfast、和x-fast。在这些情况下,每个选项的速度都是近似的,具体取决于您的首选语音。medium 选项是正常的语音速度。

  • n% 的语速:可以使用语速的任意百分比,介于 20% 和 200% 之间。在这些情况下,您可以选择自己所需的速度。不过,实际的语音速度都是近似的,具体取决于您选定的语音。100% 被视为正常的语音速度。

注意

以不同的速度测试你选择的声音。每个选项的速度都是近似值,取决于您选择的声音。

有关使用prosody标签的更多信息,请参阅控制音量、语速和音高