Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Cronometraggio della velocità di una voce
A causa della naturale variazione tra le voci, ogni voce disponibile parla a velocità leggermente diverse. Ad esempio, con le voci in inglese americano, Ivy e Joanna sono leggermente più veloci di Matthew e notevolmente più veloci di Joey. Poiché le variazioni tra le voci sono così elevate, non è disponibile una velocità standard (parole al minuto) per le voci di Amazon Polly. Tuttavia, puoi scoprire quanto tempo impiega la tua voce a pronunciare il testo selezionato utilizzando Speech Marks.
Per cronometrare la durata di un passaggio di testo parlato
-
Aprire il AWS CLI.
-
Esegui il codice seguente, compilandolo se necessario.
aws polly synthesize-speech \ --language-code
optional language code if needed
--output-format json \ --voice-id[name of desired voice]
\ --text '[desired text]
' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt -
Aprire
LengthOfText.txt
.
Se il testo fosse "Mary aveva un agnellino", le ultime righe restituite da Amazon Polly sarebbero le seguenti:
{"time":882,"type":"viseme","value":"t"}
{"time":964,"type":"viseme","value":"a"}
{"time":1082,"type":"viseme","value":"p"}
L'ultimo viseme, cioè il suono delle ultime lettere in "agnello", comincia 1082 millisecondi dopo l'inizio del discorso. Sebbene non sia esattamente la lunghezza dell'audio, è comunque prossima e può servire come base per il confronto tra le voci.