Velocidade da voz - Amazon Polly

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Velocidade da voz

Devido à variação natural entre as vozes, cada voz disponível fala em velocidades ligeiramente diferentes. Por exemplo, com vozes em inglês americano, Ivy e Joanna são um pouco mais rápidas que Matthew e consideravelmente mais rápidas que Joey. Como há muita variação entre as vozes, não há velocidade padrão (palavras por minuto) disponível para vozes do Amazon Polly. No entanto, você pode descobrir quanto tempo sua voz leva para dizer o texto selecionado usando marcas de fala.

Para cronometrar a duração de uma passagem de texto falada
  1. Abra AWS CLI o.

  2. Execute o código a seguir, preenchendo conforme necessário.

    aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt
  3. Abra o LengthOfText.txt.

Se o texto fosse "Mary had a little lamb", as últimas linhas retornadas pelo Amazon Polly seriam:

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

O último visema, essencialmente o som para as últimas letras em "lamb", começa 1.082 milissegundos após o início da fala. Embora essa não seja exatamente a duração do áudio, é próxima e pode servir como base de comparação entre vozes.

Modificar a velocidade da voz

Para determinados aplicativos, você pode preferir a voz escolhida com mais ou menos velocidade. Se a velocidade da voz for uma preocupação, o Amazon Polly oferece a capacidade de modificar isso usando tags SSML. Por exemplo, se sua organização estava criando um aplicativo que lê livros para o público imigrante, talvez você queira variar a velocidade da voz. Seu público pode falar inglês, mas sua fluência é limitada. <prosody>O Amazon Polly ajuda você a diminuir a velocidade da fala usando a tag SSML.

Você pode usar uma porcentagem:

<speak> In some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

Ou uma velocidade predefinida:

<speak> In some cases, it might help your audience to <prosody rate="slow">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

Duas opções de velocidade estão disponíveis ao usar SSML com o Amazon Polly:

  • Velocidades predefinidas: x-slowslow,medium,fast, e. x-fast Nesses casos, a velocidade de cada opção é aproximada, dependendo da sua voz de preferência. A opção medium é a velocidade normal da voz.

  • n% da taxa de fala: qualquer porcentagem da taxa de fala, entre 20% e 200%, pode ser usada. Nesses casos, você pode escolher exatamente a velocidade desejada. No entanto, a velocidade real da voz é aproximada, dependendo da voz escolhida. A velocidade normal da voz é 100%.

nota

Teste a voz selecionada em várias velocidades. A velocidade de cada opção é aproximada e depende da voz escolhida.

Para obter mais informações sobre o uso da prosody tag, consulteControlar o volume, a velocidade e o tom da fala .