Generazione di input vocale da documenti SSML - Amazon Polly

Generazione di input vocale da documenti SSML

È possibile utilizzare Amazon Polly per generare input vocale da testo semplice o documenti contrassegnati con Speech Synthesis Markup Language (SSML). L'utilizzo di testo ottimizzato per SSML fornisce ulteriore controllo sul modo in cui Amazon Polly genera la sintesi vocale dal testo fornito.

Ad esempio, è possibile includere una lunga pausa all'interno del testo o cambiando la velocità o l'intonazione della sintesi vocale. Altre opzioni includono:

  • enfatizzare parole o frasi specifiche

  • utilizzare la pronuncia fonetica

  • includere i suoni respiratori

  • sussurrare

  • utilizzare lo stile di pronuncia newscaster.

Per dettagli completi sui tag SSML supportati da Amazon Polly e su come utilizzarli, consulta Tag SSML supportati

Quando si utilizza SSML, ci sono diversi caratteri riservati che richiedono un trattamento speciale. Questo perché SSML utilizza questi caratteri come parte del suo codice. Per utilizzarli, usa un'entità specifica come carattere di escape. Per ulteriori informazioni, consulta Caratteri riservati in SSML

Amazon Polly fornisce questo tipo di controllo con un sottoinsieme di tag di markup SSML definiti da Speech Synthesis Markup Language (SSML) Version 1.1, W3C Recommendation (Speech Synthesis Markup Language (SSML) versione 1.1, specifiche W3C).

È possibile utilizzare SSML nella console di Amazon Polly o tramite AWS CLI. I seguenti argomenti illustrano come è possibile utilizzare SSML per generare discorso e controllare l'output in modo che risponda precisamente alle tue esigenze.