Tipos de marca de fala

Você solicita marcas de fala usando a SpeechMarkTypesopção para os StartSpeechSynthesisTaskcomandos SynthesizeSpeechou. Você especifica os elementos de metadados que deseja retornar do texto de entrada. Você pode solicitar até quatro tipos de metadados, mas deve especificar pelo menos um por solicitação. Nenhuma saída de áudio é gerada com a solicitação.

No AWS CLI, por exemplo:


--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

O Amazon Polly gera marcas de fala usando os seguintes elementos.

sentence – Indica um elemento de frase no texto de entrada.
word – Indica um elemento de palavra no texto.
visema: descreve os movimentos faciais e orais correspondentes a cada fonema falado. Para obter mais informações, consulte Visemas e Amazon Polly.
ssml: descreve um elemento <mark> do texto de entrada SSML. Para obter mais informações, consulte Gerar fala com base em documentos SSML.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Marcas de fala

Visemas e Amazon Polly