Tipi di contrassegni vocali - Amazon Polly

Tipi di contrassegni vocali

Puoi richiedere contrassegni vocali mediante l'opzione SpeechMarkTypes per il comando SynthesizeSpeech o StartSpeechSynthesisTask. Vengono specificati gli elementi di metadata che desideri vengano restituiti dal testo di input. Puoi richiedere quattro tipi di metadata ma devi specificarne almeno uno per richiesta. Non viene generato alcun output audio con la richiesta.

Nella AWS CLI, ad esempio:

--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly genera contrassegni vocali utilizzando i seguenti elementi:

  • sentence (frase): indica un elemento frase nel testo di input.

  • word (parola): indica un elemento parola nel testo di input.

  • viseme (visema): descrive i movimenti di volto e bocca corrispondenti a ciascun fonema pronunciato. Per ulteriori informazioni, consulta . Visemi e Amazon Polly.

  • ssml: descrive un elemento <mark> del testo di input SSML. Per ulteriori informazioni, consulta . Generazione di input vocale da documenti SSML.