Contrôle du volume, de la fréquence de parole et de la tonalité - Amazon Polly

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Contrôle du volume, de la fréquence de parole et de la tonalité

<prosody>

Les attributs des balises Prosody sont entièrement pris en charge par les voix standardTTS. Les voix neuronales volume et longues prennent en charge les rate attributs et, mais pas l'pitchattribut.

Pour contrôler le volume, le débit ou la tonalité de la voix que vous avez sélectionnée, utilisez la balise prosody.

Le volume, le débit de parole et la tonalité dépendent de la voix sélectionnée. Outre les différences entre les voix pour les différentes langues, il existe des différences entre chaque voix parlant la même langue. C'est la raison pour laquelle, tandis que les attributs sont similaires dans toutes les langues, il existe de nettes variations d'une langue à l'autre et aucune valeur absolue n'est disponible.

La balise prosody possède trois attributs, chacun d'entre eux pouvant être défini à l'aide de plusieurs valeurs. Chaque attribut utilise la même syntaxe :

<prosody attribute="value"></prosody>

  • volume

    • default : restaure le volume au niveau par défaut de la voix actuelle.

    • silent, x-soft, soft, medium, loud, x-loud : Définit le volume sur une valeur prédéfinie pour la voix actuelle.

    • +ndB, -ndB : change le volume par rapport au niveau actuel. La valeur +0dB correspond à l'absence de modification, la valeur +6dB à environ deux fois le volume actuel et la valeur -6dB à environ la moitié du volume actuel.

    Par exemple, vous pouvez définir le volume d'un passage comme suit :

    <speak> Sometimes it can be useful to <prosody volume="loud">increase the volume for a specific speech.</prosody> </speak>

    Vous pouvez également le définir de la façon suivante :

    <speak> And sometimes a lower volume <prosody volume="-6dB">is a more effective way of interacting with your audience.</prosody> </speak>
  • rate

    • x-slow,slow,medium,fast,x-fast. Définit la tonalité à une valeur prédéfinie pour la voix sélectionnée.

    • n% : changement de pourcentage non négatif du débit de parole. Par exemple, une valeur de 100 % signifie que le débit de parole n'a pas été modifié, une valeur de 200 % correspond à un débit de parole égal au double du débit par défaut, et une valeur de 50 % correspond à un débit de parole égal à la moitié du débit par défaut. Cette valeur peut être comprise entre 20 et 200 %.

    Par exemple, vous pouvez définir le débit de parole d'un passage comme suit :

    <speak> For dramatic purposes, you might wish to <prosody rate="slow">slow up the speaking rate of your text.</prosody> </speak>

    Vous pouvez également le définir de la façon suivante :

    <speak> Although in some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>
  • pitch

    • default : restaure la tonalité au niveau par défaut de la voix actuelle.

    • x-low, low, medium, high, x-high : définit la tonalité sur une valeur prédéfinie pour la voix actuelle.

    • +n% ou -n% : ajuste la tonalité sous forme d'un pourcentage relatif. Par exemple, la valeur +0% correspond à l'absence de modification de la tonalité de base, la valeur +5% attribue une tonalité de base un peu plus élevée et la valeur -5% se traduit par une tonalité de base un peu plus basse.

    Par exemple, vous pouvez définir la tonalité d'un passage comme suit :

    <speak> Do you like sythesized speech <prosody pitch="high">with a pitch that is higher than normal?</prosody> </speak>

    Vous pouvez également le définir de la façon suivante :

    <speak> Or do you prefer your speech <prosody pitch="-10%">with a somewhat lower pitch?</prosody> </speak>

La balise <prosody> doit contenir au moins un attribut, mais peut en inclure davantage.

<speak> Each morning when I wake up, <prosody volume="loud" rate="x-slow">I speak quite slowly and deliberately until I have my coffee.</prosody> </speak>

Elle peut également être combinée avec des balises imbriquées, comme suit :

<speak> <prosody rate="85%">Sometimes combining attributes <prosody pitch="-10%">can change the impression your audience has of a voice</prosody> as well.</prosody> </speak>