本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
语音标记类型
对 SynthesizeSpeech 或 StartSpeechSynthesisTask 命令使用 SpeechMarkTypes 选项来请求语音标记。您可以指定要从您输入的文本返回的元数据元素。您可以请求最多 4 种类型的元数据,但每个请求必须至少指定一种类型。未根据请求生成音频输出。
AWS CLI 中的代码示例:
--speech-mark-types='["sentence", "word", "viseme", "ssml"]'
Amazon Polly 生成使用以下元素的语音标记:
-
句子 – 表示输入文本中的句子元素。
-
单词 – 表示输入文本中的单词元素。
-
语音视位 – 描述说每个音素时的面部和口腔运动。有关更多信息,请参阅 语音视位和 Amazon Polly。
-
ssml – 描述 SSML 输入文本中的 <mark> 元素。有关更多信息,请参阅 从SSML文档生成语音。