Tipi di contrassegni vocali - Amazon Polly

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Tipi di contrassegni vocali

Puoi richiedere contrassegni vocali mediante l'opzione SpeechMarkTypes per il comando SynthesizeSpeech o StartSpeechSynthesisTask. Vengono specificati gli elementi di metadata che desideri vengano restituiti dal testo di input. Puoi richiedere quattro tipi di metadata ma devi specificarne almeno uno per richiesta. Non viene generato alcun output audio con la richiesta.

Nella AWS CLI, ad esempio:

--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly genera contrassegni vocali utilizzando i seguenti elementi:

  • sentence (frase): indica un elemento frase nel testo di input.

  • word (parola): indica un elemento parola nel testo di input.

  • viseme (visema): descrive i movimenti di volto e bocca corrispondenti a ciascun fonema pronunciato. Per ulteriori informazioni, consulta . Visemi e Amazon Polly.

  • ssml: descrive un elemento <mark> del testo di input SSML. Per ulteriori informazioni, consulta . Generazione di input vocale da documenti SSML.