Velocità della voce - Amazon Polly

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Velocità della voce

A causa della naturale variazione tra le voci, ogni voce disponibile parla a velocità leggermente diverse. Ad esempio, con le voci in inglese americano, Ivy e Joanna sono leggermente più veloci di Matthew e notevolmente più veloci di Joey. Poiché le variazioni tra le voci sono così elevate, non è disponibile una velocità standard (parole al minuto) per le voci di Amazon Polly. Tuttavia, puoi scoprire quanto tempo impiega la tua voce a pronunciare il testo selezionato utilizzando Speech Marks.

Per cronometrare la durata di un passaggio di testo parlato
  1. Aprire il AWS CLI.

  2. Esegui il codice seguente, compilandolo se necessario.

    aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt
  3. Aprire LengthOfText.txt.

Se il testo fosse "Mary aveva un agnellino", le ultime righe restituite da Amazon Polly sarebbero le seguenti:

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

L'ultimo viseme, cioè il suono delle ultime lettere in "agnello", comincia 1082 millisecondi dopo l'inizio del discorso. Sebbene non sia esattamente la lunghezza dell'audio, è comunque prossima e può servire come base per il confronto tra le voci.

Modifica della velocità della voce

In alcune applicazioni, potrebbe essere più indicato rallentare o velocizzare la voce scelta. Se la velocità della voce è un problema, Amazon Polly offre la possibilità di modificarla utilizzando i tag SSML. Ad esempio, se la tua organizzazione stava realizzando un'applicazione per leggere libri per un pubblico di immigrati, potresti voler variare la velocità della voce. Il tuo pubblico può parlare inglese, ma la loro padronanza è limitata. <prosody>Amazon Polly ti aiuta a rallentare la velocità della voce utilizzando il tag SSML.

Puoi usare una percentuale:

<speak> In some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

Oppure una velocità preimpostata:

<speak> In some cases, it might help your audience to <prosody rate="slow">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

Se si usa SSML con Amazon Polly, sono disponibili due opzioni di velocità:

  • Velocità preimpostate:x-slow,slow, mediumfast, e. x-fast In questi casi, la velocità di ciascuna opzione è approssimativa, a seconda della voce preferita. L'opzione medium è la velocità normale della voce.

  • n% della velocità vocale: è possibile utilizzare qualsiasi percentuale della velocità vocale, compresa tra il 20% e il 200%. In questi casi, è possibile scegliere esattamente la velocità desiderata. Tuttavia, la velocità reale della voce è approssimativa e dipende dalla voce scelta. 100% è consideratala velocità normale della voce.

Nota

Metti alla prova la voce selezionata a varie velocità. La velocità di ciascuna opzione è approssimativa e dipende dalla voce scelta.

Per ulteriori informazioni sull'uso del prosody tag, consultaControllo del volume, della velocità di conversazione e dell'intonazione .