Tipi di contrassegni vocali

Puoi richiedere contrassegni vocali mediante l'opzione SpeechMarkTypes per il comando SynthesizeSpeech o StartSpeechSynthesisTask. Vengono specificati gli elementi di metadata che desideri vengano restituiti dal testo di input. Puoi richiedere quattro tipi di metadata ma devi specificarne almeno uno per richiesta. Non viene generato alcun output audio con la richiesta.

Nella AWS CLI, ad esempio:


--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly genera contrassegni vocali utilizzando i seguenti elementi:

sentence (frase): indica un elemento frase nel testo di input.
word (parola): indica un elemento parola nel testo di input.
viseme (visema): descrive i movimenti di volto e bocca corrispondenti a ciascun fonema pronunciato. Per ulteriori informazioni, consulta . Visemi e Amazon Polly.
ssml: descrive un elemento <mark> del testo di input SSML. Per ulteriori informazioni, consulta . Generazione di input vocale da documenti SSML.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Contrassegni vocali

Visemi e Amazon Polly