语音标记 - Amazon Polly

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

语音标记

语音标记 是描述合成语音的元数据,例如,句子或单词在音频流中的起始和结束位置。当您为文本请求语音标记时,Amazon Polly 将返回此元数据,而不是合成语音。通过将语音标记与合成语音音频流配合使用,您可以为您的应用程序提供更强的视觉体验。

例如,通过将元数据与来自文本的音频流组合使用,您就能够将语音与面部动画同步(嘴唇同步),或者在说出字幕单词时对其进行突出显示。

使用神经格式或标准 text-to-speech格式时可以使用语音标记。