Cronometraggio della velocità di una voce - Amazon Polly

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Cronometraggio della velocità di una voce

A causa della naturale variazione tra le voci, ogni voce disponibile parla a velocità leggermente diverse. Ad esempio, con le voci in inglese americano, Ivy e Joanna sono leggermente più veloci di Matthew e notevolmente più veloci di Joey. Poiché le variazioni tra le voci sono così elevate, non è disponibile una velocità standard (parole al minuto) per le voci di Amazon Polly. Tuttavia, puoi scoprire quanto tempo impiega la tua voce a pronunciare il testo selezionato utilizzando Speech Marks.

Per cronometrare la durata di un passaggio di testo parlato
  1. Aprire il AWS CLI.

  2. Esegui il codice seguente, compilandolo se necessario.

    aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt
  3. Aprire LengthOfText.txt.

Se il testo fosse "Mary aveva un agnellino", le ultime righe restituite da Amazon Polly sarebbero le seguenti:

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

L'ultimo viseme, cioè il suono delle ultime lettere in "agnello", comincia 1082 millisecondi dopo l'inizio del discorso. Sebbene non sia esattamente la lunghezza dell'audio, è comunque prossima e può servire come base per il confronto tra le voci.