Solicitar marcas de fala

É possível usar o console ou o comando synthesize-speech para solicitar marcas de fala do Amazon Polly. Em seguida, visualize os metadados ou salve-os em um arquivo.

Console

Como gerar marcas de fala no console

Faça login no AWS Management Console e abra o console do Amazon Polly em. https://console.aws.amazon.com/polly/
Selecione a guia Text-to-Speech.
Ative o SSML para usar o SSML.
Digite ou cole o texto na caixa de entrada.
Para Idioma, escolha o idioma do texto.
Para Voz, escolha a voz que você deseja usar.
Para alterar a pronúncia do texto, expanda Configurações adicionais, ative Personalizar pronúncia e, em Aplicar léxico, escolha o léxico desejado.
Para verificar a fala, escolha Ouvir.
Ative as Configurações de formato de arquivo de voz.

nota
Os formatos de download MP3, OGG ou PCM não gerarão marcas de fala.
Para Formato de arquivo, escolha Marcas de fala.
Para Tipos de marca de fala, escolha os tipos de marcas de fala a serem gerados. A opção para escolher metadados SSML só está disponível quando o SSML está ativo. Para obter mais informações sobre como usar SSML com o Amazon Polly, consulte Gerar fala com base em documentos SSML.
Escolha Baixar.

AWS CLI

Além do texto de entrada, os seguintes elementos são necessários para retornar esses metadados:

output-format

O Amazon Polly é compatível apenas com o formato JSON ao retornar marcas de fala.
```
--output-format json
```
Se você usar um formato de saída não compatível, o Amazon Polly lançará uma exceção.
voice-id

Para garantir que os metadados correspondam ao fluxo de áudio associado, especifique a mesma voz usada para gerar o fluxo de áudio de fala sintetizado. As vozes disponíveis não têm velocidades de fala idênticas. Se você usar uma voz diferente daquela usado para gerar a fala, os metadados não corresponderão ao fluxo de áudio.
```
--voice-id Joanna
```
speech-mark-types

Especifique os tipos de marcas de fala desejados. Você pode solicitar qualquer um ou todos os tipos de marca de fala, mas deve especificar pelo menos um tipo.
```
--speech-mark-types='["sentence", "word", "viseme", "ssml"]'
```
text-type

Texto sem formatação é o padrão para texto de entrada no Amazon Polly. Você deve usar text-type ssml se quiser retornar marcas de fala em SSML.
outfile

Especifique o arquivo de saída ao qual os metadados são gravados.
```
MaryLamb.txt 
```

O AWS CLI exemplo a seguir está formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um acento circunflexo (^) e use aspas completas (") ao redor do texto de entrada com aspas simples (') para tags internas.


aws polly synthesize-speech \
  --output-format json \
  --voice-id Voice ID \
  --text 'Input text' \
  --speech-mark-types='["sentence", "word", "viseme"]' \
  outfile

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Saída da marca de fala

Exemplo de marcas de fala sem SSML

Solicitar marcas de fala

Como gerar marcas de fala no console

nota