本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
对语音速度进行计时
由于语音之间的自然差异,每个可用的语音会以略微不同的速度朗读文本。例如,对于美国英语语音,Ivy 和 Joanna 的语速比 Matthew 的语速略快一点,比 Joey 的语速快很多。由于语音之间有很大的差异,因此,对于 Amazon Polly 语音来说没有任何标准语速(每分钟单词数)。不过,您可以使用语音标记来查明用您的语音朗读选定文本需要多长时间。
对口语文本段落长度进行计时
-
打开 AWS CLI。
-
运行以下代码(根据需要填充)。
aws polly synthesize-speech \ --language-code
optional language code if needed
--output-format json \ --voice-id[name of desired voice]
\ --text '[desired text]
' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt -
打开
LengthOfText.txt
。
如果文本为“Mary had a little lamb”,则 Amazon Polly 返回的最后几行将为:
{"time":882,"type":"viseme","value":"t"}
{"time":964,"type":"viseme","value":"a"}
{"time":1082,"type":"viseme","value":"p"}
最后一个 viseme(本质上是“lamb”的最后几个字母的读音)在语音开始后 1082 毫秒开始。虽然这不是音频的准确长度,但很接近,可用作比较语音的基础。