Criar arquivos de áudio longos

É possível usar o console do Amazon Polly para criar falas longas usando a síntese assíncrona com a mesma funcionalidade que você pode usar com a AWS CLI. Isso é feito usando a guia Text-to-Speech (Texto para fala) da mesma maneira que qualquer outra síntese.

Console

A outra funcionalidade de síntese assíncrona também está disponível pelo console. A guia S3 synthesis tasks (Tarefas de síntese do S3) reflete a funcionalidade ListSpeechSynthesisTasks, exibindo todas as tarefas salvas no bucket do S3 e permitindo filtrá-las, se desejar. Clicar em uma única tarefa específica mostra seus detalhes, refletindo a funcionalidade GetSpeechSynthesisTask.

Como sintetizar um texto grande usando o console do Amazon Polly

Faça login no AWS Management Console e abra o console do Amazon Polly em. https://console.aws.amazon.com/polly/
Selecione a guia Text-to-Speech. Selecione Formato longo como o mecanismo, se apropriado.
Com SSML ativo ou inativo, digite ou cole seu texto na caixa de entrada.
Selecione o idioma, a região e a voz para seu texto.
Escolha Salvar no S3.

nota
As opções Fazer download e Ouvir estarão esmaecidas se o comprimento do texto estiver acima do limite de 3.000 caracteres da operação SynthesizeSpeech em tempo real.
O console abre um formulário para que você possa escolher onde armazenar o arquivo de saída.
1. Preencha o nome do bucket do Amazon S3 de destino.
2. Se preferir, preencha o prefixo de chaves da saída.
  
  nota
  A bucket do S3 de saída deve ser gravável.
3. Se você deseja ser notificado quando a tarefa de síntese tarefa for concluída, forneça o identificador opcional do tópico do SNS.
  
  nota
  O SNS deve estar aberto para publicação pelo usuário atual do console para usar essa opção. Para obter mais informações, consulte Amazon Simple Notification Service (SNS)
4. Escolha Salvar no S3.

Para recuperar informações sobre suas tarefas de síntese de fala

No console, selecione a guia Tarefas de síntese do S3.
As tarefas são exibidas por ordem de data. Para filtrar as tarefas por status, escolha Todos os status e defina o status a ser usado.
Para visualizar os detalhes de uma tarefa específica, selecione o Task ID (ID da tarefa) vinculado.

AWS CLI

A funcionalidade de síntese assíncrona do Amazon Polly usa três SpeechSynthesisTask APIs para trabalhar com grandes quantidades de texto:

StartSpeechSynthesisTask: começa uma nova tarefa de síntese.
GetSpeechSynthesisTask: retorna detalhes sobre uma tarefa de síntese enviada anteriormente.
ListSpeechSynthesisTasks: lista todas as tarefas de síntese enviadas.

Sintetizar grandes quantidades de texto (StartSpeechSynthesisTask)

Quando quiser criar um arquivo de áudio maior do que pode criar com a operação SynthesizeSpeech em tempo real, use a operação StartSpeechSynthesisTask. Além dos argumentos necessários para a operação SynthesizeSpeech, a StartSpeechSynthesisTask também exige o nome de um bucket do Amazon S3. Outros dois argumentos opcionais também estão disponíveis: um prefixo de chaves para o arquivo de saída e o ARN de um tópico do SNS, se quiser receber notificações de status sobre a tarefa.

OutputS3BucketName: o nome do bucket do Amazon S3 para o qual deve ser feito o upload da síntese. Esse bucket deve estar na mesma região que o serviço do Amazon Polly. Além disso, o usuário do IAM que está sendo usado para fazer a chamada deve ter acesso ao bucket. [Obrigatório]
OutputS3KeyPrefix: prefixo de chaves para o arquivo de saída. Use este parâmetro se deseja salvar o arquivo de saída da fala em uma chave personalizada como um diretório em seu bucket. [Opcional]
SnsTopicArn: o ARN do tópico do SNS a ser usado se quiser receber notificações sobre o status da tarefa. Esse tópico do SNS deve estar na mesma região que o serviço do Amazon Polly. Além disso, o usuário do IAM que está sendo usado para fazer a chamada deve ter acesso ao tópico. (Opcional)

Por exemplo, o exemplo a seguir pode ser usado para executar o start-speech-synthesis-task AWS CLI comando na região Leste dos EUA (Ohio):

O AWS CLI exemplo a seguir está formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um acento circunflexo (^) e use aspas completas (") ao redor do texto de entrada com aspas simples (') para tags internas.


aws polly start-speech-synthesis-task \
  --region us-east-2 \
  --endpoint-url "https://polly.us-east-2.amazonaws.com/" \
  --output-format mp3 \
  --output-s3-bucket-name your-bucket-name \
  --output-s3-key-prefix optional/prefix/path/file \
  --voice-id Joanna \
  --text file://text_file.txt

Isso resultará em uma resposta semelhante a esta:


"SynthesisTask": 
{
     "OutputFormat": "mp3",
     "OutputUri": "https://s3.us-east-2.amazonaws.com/your-bucket-name/optional/prefix/path/file.<task_id>.mp3",
     "TextType": "text",
     "CreationTime": [..],
     "RequestCharacters": [..],
     "TaskStatus": "scheduled",
     "TaskId": [task_id],
     "VoiceId": "Joanna"
 }

A operação start-speech-synthesis-task retorna diversos campos novos:

OutputUri: o local do seu arquivo de saída da fala.
TaskId: um identificador exclusivo para a tarefa de síntese de fala gerado pelo Amazon Polly.
CreationTime: um time stamp de quando a tarefa foi inicialmente enviada.
RequestCharacters: o número de caracteres faturáveis na tarefa.
TaskStatus: fornece informações sobre o status da tarefa enviada.

Quando a tarefa for enviada, o status inicial será exibido como scheduled. Quando o Amazon Polly começar a processar a tarefa, o status será alterado para inProgress e depois para completed ou failed. Se a tarefa falhar, uma mensagem de erro será retornada ao chamar a ListSpeechSynthesisTasks operação GetSpeechSynthesisTask ou.

Quando a tarefa for concluída, o arquivo da fala estará disponível no local especificado em OutputUri.

Recuperar informações sobre sua tarefa de síntese de fala

É possível obter informações sobre uma tarefa, como erros, status e assim por diante, usando a operação GetSpeechSynthesisTask. Para fazer isso, você precisará do task-id retornado pelo StartSpeechSynthesisTask.

Por exemplo, o exemplo a seguir pode ser usado para executar o get-speech-synthesis-task AWS CLI comando:


aws polly get-speech-synthesis-task \
--region us-east-2 \
--endpoint-url "https:// polly.us-east-2.amazonaws.com/" \
--task-id task identifier

Também é possível listar todas as tarefas de síntese de fala que você executou na região atual usando a operação ListSpeechSynthesisTasks.

Por exemplo, o exemplo a seguir pode ser usado para executar o list-speech-synthesis-tasks AWS CLI comando:


aws polly list-speech-synthesis-tasks \
--region us-east-2 \
--endpoint-url "https:// polly.us-east-2.amazonaws.com/"

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Configurar a política do IAM para a síntese assíncrona

Cotas

Criar arquivos de áudio longos

Como sintetizar um texto grande usando o console do Amazon Polly

nota

nota

nota

Para recuperar informações sobre suas tarefas de síntese de fala