Ejemplos de marcas de voz - Amazon Polly

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ejemplos de marcas de voz

En los siguientes ejemplos de solicitudes de marcas de voz se muestra cómo realizar solicitudes comunes y el resultado que generan.

Ejemplo 1: marcas de voz sin SSML

En el ejemplo siguiente se muestra el aspecto aproximado que tendrán en su pantalla los metadatos de la frase "Mary had a little lamb" solicitados. Por simplificar, no se han incluido las marcas de voz SSML en el ejemplo.

El ejemplo de AWS CLI siguiente tiene formato para Unix, Linux y macOS. En Windows, sustituya la barra invertida (\) que continúa en Unix al final de cada línea por un signo de intercalación (^) y utilice comillas completas (") alrededor del texto de entrada con comillas simples (') para las etiquetas interiores.

aws polly synthesize-speech \ --output-format json \ --voice-id Joanna \ --text 'Mary had a little lamb.' \ --speech-mark-types='["viseme", "word", "sentence"]' \ MaryLamb.txt

Si realiza esta solicitud, Amazon Polly devuelve lo siguiente en el archivo .txt:

{"time":0,"type":"sentence","start":0,"end":23,"value":"Mary had a little lamb."} {"time":6,"type":"word","start":0,"end":4,"value":"Mary"} {"time":6,"type":"viseme","value":"p"} {"time":73,"type":"viseme","value":"E"} {"time":180,"type":"viseme","value":"r"} {"time":292,"type":"viseme","value":"i"} {"time":373,"type":"word","start":5,"end":8,"value":"had"} {"time":373,"type":"viseme","value":"k"} {"time":460,"type":"viseme","value":"a"} {"time":521,"type":"viseme","value":"t"} {"time":604,"type":"word","start":9,"end":10,"value":"a"} {"time":604,"type":"viseme","value":"@"} {"time":643,"type":"word","start":11,"end":17,"value":"little"} {"time":643,"type":"viseme","value":"t"} {"time":739,"type":"viseme","value":"i"} {"time":769,"type":"viseme","value":"t"} {"time":799,"type":"viseme","value":"t"} {"time":882,"type":"word","start":18,"end":22,"value":"lamb"} {"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

En este resultado, cada parte del texto está dividido en función de las marcas de voz:

  • Por un lado, la frase "Mary had a little lamb".

  • Por otro lado, cada palabra del texto: "Mary", "had", "a", "little" y "lamb".

  • Por último, el visema de cada sonido de la secuencia de audio correspondiente: "p", "E", "r", "i", etc. Para obtener más información sobre los visemas, consulte Visemas y Amazon Polly.

Ejemplo 2: marcas de voz con SSML

El proceso de generar marcas de voz desde un texto mejorado con SSML es muy parecido al proceso que se utiliza cuando SSML no está presente. Utilice el comando synthesize-speech, especifique el texto mejorado con SSML y determine el tipo de marcas de voz que desea usar, tal y como se muestra en el ejemplo siguiente. Para que el ejemplo resulte más fácil de leer, no hemos incluido las marcas de voz de los visemas, pero también podrían incluirse.

El ejemplo de AWS CLI siguiente tiene formato para Unix, Linux y macOS. En Windows, sustituya la barra invertida (\) que continúa en Unix al final de cada línea por un signo de intercalación (^) y utilice comillas completas (") alrededor del texto de entrada con comillas simples (') para las etiquetas interiores.

aws polly synthesize-speech \ --output-format json \ --voice-id Joanna \ --text-type ssml \ --text '<speak><prosody volume="+20dB">Mary had <break time="300ms"/>a little <mark name="animal"/>lamb</prosody></speak>' \ --speech-mark-types='["sentence", "word", "ssml"]' \ output.txt

Si realiza esta solicitud, Amazon Polly devuelve lo siguiente en el archivo .txt:

{"time":0,"type":"sentence","start":31,"end":95,"value":"Mary had <break time=\"300ms\"\/>a little <mark name=\"animal\"\/>lamb"} {"time":6,"type":"word","start":31,"end":35,"value":"Mary"} {"time":325,"type":"word","start":36,"end":39,"value":"had"} {"time":897,"type":"word","start":40,"end":61,"value":"<break time=\"300ms\"\/>"} {"time":1291,"type":"word","start":61,"end":62,"value":"a"} {"time":1373,"type":"word","start":63,"end":69,"value":"little"} {"time":1635,"type":"ssml","start":70,"end":91,"value":"animal"} {"time":1635,"type":"word","start":91,"end":95,"value":"lamb"}