Solicitando marcas de fala - Amazon Polly

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Solicitando marcas de fala

Você pode usar o console ou o synthesize-speech comando para solicitar marcas de fala do Amazon Polly. Em seguida, visualize os metadados ou salve-os em um arquivo.

Console
Para gerar marcas de fala no console
  1. Faça login no AWS Management Console e abra o console do Amazon Polly em. https://console.aws.amazon.com/polly/

  2. Selecione a guia Text-to-Speech.

  3. Ative SSMLpara usarSSML.

  4. Digite ou cole o texto na caixa de entrada.

  5. Em Idioma, escolha o idioma do seu texto.

  6. Em Voz, escolha a voz que você deseja usar.

  7. Para alterar a pronúncia do texto, expanda Configurações adicionais, ative Personalizar pronúncia e, em Aplicar léxico, escolha o léxico desejado.

  8. Para verificar a fala, escolha Ouvir.

  9. Ative as Configurações de formato de arquivo de voz.

    nota

    Baixar MP3 ou PCM formatar não gerará marcas de fala. OGG

  10. Para Formato de arquivo, escolha Marcas de fala.

  11. Para Tipos de marca de fala, escolha os tipos de marcas de fala a serem gerados. A opção de escolher SSMLmetadados só está disponível quando SSMLestá ativada. Para obter mais informações sobre como usar SSML com o Amazon Polly, consulte. Gerando fala a partir de SSML documentos

  12. Escolha Baixar.

AWS CLI

Além do texto de entrada, os seguintes elementos são necessários para retornar esses metadados:

  • output-format

    O Amazon Polly suporta somente o JSON formato ao retornar marcas de fala.

    --output-format json

    Se você usar um formato de saída não compatível, o Amazon Polly lançará uma exceção.

  • voice-id

    Para garantir que os metadados correspondam ao fluxo de áudio associado, especifique a mesma voz usada para gerar o fluxo de áudio de fala sintetizado. As vozes disponíveis não têm velocidades de fala idênticas. Se você usar uma voz diferente daquela usado para gerar a fala, os metadados não corresponderão ao fluxo de áudio.

    --voice-id Joanna
  • speech-mark-types

    Especifique os tipos de marcas de fala desejados. Você pode solicitar qualquer um ou todos os tipos de marca de fala, mas deve especificar pelo menos um tipo.

    --speech-mark-types='["sentence", "word", "viseme", "ssml"]'
  • text-type

    O texto sem formatação é o texto de entrada padrão do Amazon Polly, então você deve usá-lo text-type ssml se quiser retornar marcas de SSML fala.

  • outfile

    Especifique o arquivo de saída ao qual os metadados são gravados.

    MaryLamb.txt

O AWS CLI exemplo a seguir está formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um acento circunflexo (^) e use aspas completas (") ao redor do texto de entrada com aspas simples (') para tags internas.

aws polly synthesize-speech \ --output-format json \ --voice-id Voice ID \ --text 'Input text' \ --speech-mark-types='["sentence", "word", "viseme"]' \ outfile