Cronometraggio della velocità di una voce

A causa della naturale variazione tra le voci, ogni voce disponibile parla a velocità leggermente diverse. Ad esempio, con le voci in inglese americano, Ivy e Joanna sono leggermente più veloci di Matthew e notevolmente più veloci di Joey. Poiché le variazioni tra le voci sono così elevate, non è disponibile una velocità standard (parole al minuto) per le voci di Amazon Polly. Tuttavia, puoi scoprire quanto tempo impiega la tua voce a pronunciare il testo selezionato utilizzando Speech Marks.

Per cronometrare la durata di un passaggio di testo parlato

Aprire il AWS CLI.

Esegui il codice seguente, compilandolo se necessario.


     aws polly synthesize-speech \
          --language-code optional language code if needed
          --output-format json \
          --voice-id [name of desired voice] \
          --text '[desired text]' \
          --speech-mark-types='["viseme"]' \
          LengthOfText.txt

Aprire LengthOfText.txt.

Se il testo fosse "Mary aveva un agnellino", le ultime righe restituite da Amazon Polly sarebbero le seguenti:


     {"time":882,"type":"viseme","value":"t"}
     {"time":964,"type":"viseme","value":"a"}
     {"time":1082,"type":"viseme","value":"p"}

L'ultimo viseme, cioè il suono delle ultime lettere in "agnello", comincia 1082 millisecondi dopo l'inizio del discorso. Sebbene non sia esattamente la lunghezza dell'audio, è comunque prossima e può servire come base per il confronto tra le voci.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Ascoltare le voci

Modifica della velocità di una voce