Tipi di segni vocali

È possibile richiedere i contrassegni vocali utilizzando l'SpeechMarkTypesopzione relativa ai StartSpeechSynthesisTaskcomandi SynthesizeSpeecho. Vengono specificati gli elementi di metadata che desideri vengano restituiti dal testo di input. Puoi richiedere quattro tipi di metadata ma devi specificarne almeno uno per richiesta. Non viene generato alcun output audio con la richiesta.

In AWS CLI, ad esempio:


--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly genera contrassegni vocali utilizzando i seguenti elementi:

sentence (frase): indica un elemento frase nel testo di input.
word (parola): indica un elemento parola nel testo di input.
viseme (visema): descrive i movimenti di volto e bocca corrispondenti a ciascun fonema pronunciato. Per ulteriori informazioni, consulta Visemi e Amazon Polly.
ssml: descrive un elemento <mark> del testo di input SSML. Per ulteriori informazioni, consulta Generazione vocale da documenti SSML.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Segni vocali

Visemi e Amazon Polly