Contrassegni vocali - Amazon Polly

Contrassegni vocali

I contrassegni vocali sono metadata che descrivono la sintesi vocale, ad esempio il punto in cui una frase o parola inizia e finisce nel flusso audio. Quando richiedi contrassegni vocali per il tuo testo, Amazon Polly restituisce questi metadati anziché la sintesi vocale. Utilizzando i contrassegni vocali in combinazione con il flusso audio della sintesi vocale, è possibile offrire alle tue applicazioni un'esperienza visiva ottimizzata.

Ad esempio, la combinazione di metadati con il flusso audio del tuo testo consente di sincronizzare la sintesi vocale con le animazioni del volto (sincronia labiale) o di evidenziare le parole scritte appena vengono pronunciate.

I contrassegni vocali sono disponibili quando si utilizzano i formati di sintesi vocale neurali o standard.