Tipos de marcas de voz

Las marcas de voz se solicitan mediante la SpeechMarkTypesopción de los comandos SynthesizeSpeecho StartSpeechSynthesisTask. Debe especificar los metadatos del texto de entrada que quiere que se devuelvan. Puede solicitar hasta cuatro tipos de metadatos y debe especificar al menos uno en cada solicitud. Esta solicitud no genera ninguna salida de audio.

En AWS CLI, por ejemplo:


--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly genera las marcas de voz utilizando los siguientes elementos:

sentence: sirve para señalar frases en el texto de entrada.
word: sirve para señalar palabras en el texto.
viseme: describe los movimientos de la cara y la boca que corresponden a cada fonema que se pronuncia. Para obtener más información, consulte Visemas y Amazon Polly.
ssml describe un elemento <mark> del texto de entrada SSML. Para obtener más información, consulte Generación de fragmentos hablados desde documentos SSML.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Marcas de voz

Visemas y Amazon Polly