Generazione vocale da documenti SSML

È possibile utilizzare Amazon Polly per generare input vocale da testo semplice o documenti contrassegnati con Speech Synthesis Markup Language (SSML). L'utilizzo di testo ottimizzato per SSML fornisce ulteriore controllo sul modo in cui Amazon Polly genera la sintesi vocale dal testo fornito.

Con i tag SSML, è possibile personalizzare e controllare diversi aspetti del discorso restituito, ad esempio pronuncia, volume e velocità. In AWS Management Console, il testo migliorato con SSML che si desidera convertire in audio viene immesso nella scheda SSML della pagina. Text-to-Speech Sebbene il testo inserito come testo normale si basi su impostazioni predefinite per la lingua e la voce scelte, il testo ottimizzato per SSML comunica a Amazon Polly non solo ciò che si desidera dire, ma anche il modo in cui dirlo. Ad eccezione dell'aggiunta dei tag SSML, Amazon Polly sintetizza il testo ottimizzato per SSML nello stesso modo in cui sintetizza il testo normale. Per ulteriori informazioni, consulta Esempio di sintesi vocale con Amazon Polly.

Quando si utilizza SSML, l'intero testo viene racchiuso in un tag <speak> per comunicare a Amazon Polly che si sta utilizzando SSML. Ad esempio:


<speak>Hi! My name is Joanna. I will read any text you type here.</speak>

Si possono quindi utilizzare tag SSML specifici sul testo all'interno dei tag <speak> per personalizzare il modo in cui si desidera che il testo suoni. È possibile aggiungere una pausa, modificare il ritmo del discorso, ridurre o aumentare il volume della voce o aggiungere molte altre personalizzazioni in modo che il testo corrisponda alle aspettative. Per un elenco completo dei tag SSML utilizzabili consultare Tag SSML supportati.

Ad esempio, è possibile includere una lunga pausa all'interno del testo o cambiando la velocità o l'intonazione della sintesi vocale. Altre opzioni includono:

enfatizzare parole o frasi specifiche
utilizzare la pronuncia fonetica
includere i suoni respiratori
sussurrare
utilizzare lo stile di pronuncia newscaster.

Per dettagli completi sui tag SSML supportati da Amazon Polly e su come utilizzarli, consulta Tag SSML supportati

Quando si utilizza SSML, ci sono diversi caratteri riservati che richiedono un trattamento speciale. Questo perché SSML utilizza questi caratteri come parte del suo codice. Per utilizzarli, usa un'entità specifica come carattere di escape. Per ulteriori informazioni, consulta Caratteri riservati in SSML

Amazon Polly fornisce questo tipo di controllo con un sottoinsieme di tag di markup SSML definiti da Speech Synthesis Markup Language (SSML) Version 1.1, W3C Recommendation (Speech Synthesis Markup Language (SSML) versione 1.1, specifiche W3C).

È possibile utilizzare SSML nella console di Amazon Polly o tramite AWS CLI. I seguenti argomenti illustrano come è possibile utilizzare SSML per generare discorso e controllare l'output in modo che risponda precisamente alle tue esigenze.

Argomenti

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Esempio di segni vocali con SSML

Personaggi riservati