对语音速度进行计时 - Amazon Polly

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

对语音速度进行计时

由于语音之间的自然差异,每个可用的语音会以略微不同的速度朗读文本。例如,对于美国英语语音,Ivy 和 Joanna 的语速比 Matthew 的语速略快一点,比 Joey 的语速快很多。由于语音之间有很大的差异,因此,对于 Amazon Polly 语音来说没有任何标准语速(每分钟单词数)。不过,您可以使用语音标记来查明用您的语音朗读选定文本需要多长时间。

对口语文本段落长度进行计时
  1. 打开 AWS CLI。

  2. 运行以下代码(根据需要填充)。

    aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt
  3. 打开 LengthOfText.txt

如果文本为“Mary had a little lamb”,则 Amazon Polly 返回的最后几行将为:

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

最后一个 viseme(本质上是“lamb”的最后几个字母的读音)在语音开始后 1082 毫秒开始。虽然这不是音频的准确长度,但很接近,可用作比较语音的基础。