Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Control del volumen, velocidad de habla y tono
<prosody>
Los atributos de las etiquetas de prosodia son totalmente compatibles con las voces estándar. TTS Las voces neuronales y de formato largo admiten los atributos volume
y rate
, pero no admiten el atributo pitch
.
Para controlar el volumen, la velocidad o el tono de la voz seleccionada, utilice la etiquetaprosody
.
El volumen, la velocidad de habla, y el tono dependen de la voz seleccionada. Además de las diferencias entre las voces de diferentes idiomas, existen diferencias entre las voces que hablan el mismo idioma. Por este motivo, aunque los atributos son similares en todos los idiomas, existen claras variaciones de un idioma a otro y no hay ningún valor absoluto disponible.
La etiqueta prosody
tiene tres atributos, cada uno de los cuales tiene varios valores disponibles para establecer el atributo. Todos los atributos utilizan la misma sintaxis:
<prosody attribute
="value
"></prosody>
-
volume
-
default
: restablece el volumen al nivel predeterminado de la voz actual. -
silent
,x-soft
,soft
,medium
,loud
,x-loud
: establece el volumen en un valor predefinido de la voz actual. -
+ndB
,-ndB
: cambia el volumen en función del nivel actual. El valor+0dB
significa que no se producen cambios,+6dB
significa aproximadamente el doble del volumen actual y-6dB
significa aproximadamente la mitad del volumen actual.
Por ejemplo, puede establecer el volumen de un pasaje tal y como se indica a continuación:
<speak> Sometimes it can be useful to <prosody volume="loud">increase the volume for a specific speech.</prosody> </speak>
También se puede hacer de este modo:
<speak> And sometimes a lower volume <prosody volume="-6dB">is a more effective way of interacting with your audience.</prosody> </speak>
-
-
rate
-
x-slow
,slow
,medium
,fast
,x-fast
: establece el tono en un valor predefinido para la voz seleccionada. -
n%
: un cambio de porcentaje no negativo en la velocidad de habla. Por ejemplo, un valor de 100% significa que no hay ningún cambio en la velocidad de habla; un valor de 200% significa una velocidad dos veces superior a la velocidad predeterminada y un valor de 50% significa una velocidad de habla a la mitad de la velocidad predeterminada. Este valor tiene un intervalo de 20-200%.
Por ejemplo, puede establecer la velocidad de habla de un pasaje tal y como se indica a continuación:
<speak> For dramatic purposes, you might wish to <prosody rate="slow">slow up the speaking rate of your text.</prosody> </speak>
También se puede hacer de este modo:
<speak> Although in some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>
-
-
pitch
-
default
: restablece el tono en el valor predeterminado de la voz actual. -
x-low
,low
,medium
,high
,x-high
: establece el tono en un valor predefinido de la voz actual. -
+n%
o-n%
: ajusta el tono aplicando un porcentaje relativo. Por ejemplo, un valor de+0%
significa que no hay ningún cambio en el tono de base de referencia,+5%
da como resultado un tono de base de referencia un poco más alto y-5%
da como resultado un tono de base de referencia un poco más bajo.
Por ejemplo, puede establecer el tono de un pasaje tal y como se indica a continuación:
<speak> Do you like sythesized speech <prosody pitch="high">with a pitch that is higher than normal?</prosody> </speak>
También se puede hacer de este modo:
<speak> Or do you prefer your speech <prosody pitch="-10%">with a somewhat lower pitch?</prosody> </speak>
-
La etiqueta <prosody> debe contener al menos un atributo, pero puede incluir más dentro de la misma etiqueta.
<speak> Each morning when I wake up, <prosody volume="loud" rate="x-slow">I speak quite slowly and deliberately until I have my coffee.</prosody> </speak>
También se puede combinar con etiquetas anidadas, tal y como se indica a continuación:
<speak> <prosody rate="85%">Sometimes combining attributes <prosody pitch="-10%">can change the impression your audience has of a voice</prosody> as well.</prosody> </speak>