As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Solicitando marcas de fala
Você pode usar o console ou o synthesize-speech
comando para solicitar marcas de fala do Amazon Polly. Em seguida, visualize os metadados ou salve-os em um arquivo.
- Console
-
Para gerar marcas de fala no console
Faça login no AWS Management Console e abra o console do Amazon Polly em. https://console.aws.amazon.com/polly/
-
Selecione a guia Text-to-Speech.
-
Ative SSMLpara usarSSML.
-
Digite ou cole o texto na caixa de entrada.
-
Em Idioma, escolha o idioma do seu texto.
-
Em Voz, escolha a voz que você deseja usar.
-
Para alterar a pronúncia do texto, expanda Configurações adicionais, ative Personalizar pronúncia e, em Aplicar léxico, escolha o léxico desejado.
-
Para verificar a fala, escolha Ouvir.
-
Ative as Configurações de formato de arquivo de voz.
nota
Baixar MP3 ou PCM formatar não gerará marcas de fala. OGG
-
Para Formato de arquivo, escolha Marcas de fala.
-
Para Tipos de marca de fala, escolha os tipos de marcas de fala a serem gerados. A opção de escolher SSMLmetadados só está disponível quando SSMLestá ativada. Para obter mais informações sobre como usar SSML com o Amazon Polly, consulte. Gerando fala a partir de SSML documentos
-
Escolha Baixar.
- AWS CLI
-
Além do texto de entrada, os seguintes elementos são necessários para retornar esses metadados:
-
output-format
O Amazon Polly suporta somente o JSON formato ao retornar marcas de fala.
--output-format json
Se você usar um formato de saída não compatível, o Amazon Polly lançará uma exceção.
-
voice-id
Para garantir que os metadados correspondam ao fluxo de áudio associado, especifique a mesma voz usada para gerar o fluxo de áudio de fala sintetizado. As vozes disponíveis não têm velocidades de fala idênticas. Se você usar uma voz diferente daquela usado para gerar a fala, os metadados não corresponderão ao fluxo de áudio.
--voice-id Joanna
-
speech-mark-types
Especifique os tipos de marcas de fala desejados. Você pode solicitar qualquer um ou todos os tipos de marca de fala, mas deve especificar pelo menos um tipo.
--speech-mark-types='["sentence", "word", "viseme", "ssml"]'
-
text-type
O texto sem formatação é o texto de entrada padrão do Amazon Polly, então você deve usá-lo
text-type ssml
se quiser retornar marcas de SSML fala. -
outfile
Especifique o arquivo de saída ao qual os metadados são gravados.
MaryLamb.txt
O AWS CLI exemplo a seguir está formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um acento circunflexo (^) e use aspas completas (") ao redor do texto de entrada com aspas simples (') para tags internas.
aws polly synthesize-speech \ --output-format json \ --voice-id
Voice ID
\ --text 'Input text
' \ --speech-mark-types='["sentence", "word", "viseme"]' \outfile
-