StartSpeechSynthesisTask - Amazon Polly

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

StartSpeechSynthesisTask

Permite a criação de uma tarefa de síntese assíncrona, iniciando uma nova SpeechSynthesisTask. Essa operação requer todas as informações padrão necessárias para a síntese de fala, além do nome de um bucket do Amazon S3 para que o serviço armazene a saída da tarefa de síntese e dois parâmetros opcionais (OutputS3KeyPrefix e SnsTopicArn). Depois que a tarefa de síntese for criada, a operação retornará um objeto de SpeechSynthesisTask que incluirá um identificador a tarefa e o status atual. O objeto SpeechSynthesisTask fica disponível por 72 horas após o início da tarefa de síntese assíncrona.

Sintaxe da Solicitação

POST /v1/synthesisTasks HTTP/1.1 Content-type: application/json { "Engine": "string", "LanguageCode": "string", "LexiconNames": [ "string" ], "OutputFormat": "string", "OutputS3BucketName": "string", "OutputS3KeyPrefix": "string", "SampleRate": "string", "SnsTopicArn": "string", "SpeechMarkTypes": [ "string" ], "Text": "string", "TextType": "string", "VoiceId": "string" }

Parâmetros da solicitação de URI

A solicitação não usa nenhum parâmetro de URI.

Corpo da Solicitação

A solicitação aceita os dados a seguir no formato JSON.

Engine

Especifica o mecanismo (standardneural, long-form ougenerative) que o Amazon Polly deve usar ao processar o texto de entrada para síntese de fala. Usar uma voz que não seja compatível com o mecanismo selecionado resultará em erro.

Tipo: sequências

Valores Válidos: standard | neural | long-form | generative

Obrigatório: não

LanguageCode

Código de idioma opcional para a solicitação de síntese de fala. É necessário apenas se estiver usando uma voz bilíngue, como Aditi, que pode ser usada para inglês indiano (en-IN) ou hindi (hi-IN).

Se uma voz bilíngue for usada e nenhum código de idioma for especificado, o Amazon Polly usará o idioma padrão da voz bilíngue. O idioma padrão para qualquer voz é aquele retornado pela DescribeVoicesoperação do LanguageCode parâmetro. Por exemplo, se nenhum código de idioma for especificado, Aditi usará inglês indiano em vez de hindi.

Tipo: sequências

Valores Válidos: arb | cmn-CN | cy-GB | da-DK | de-DE | en-AU | en-GB | en-GB-WLS | en-IN | en-US | es-ES | es-MX | es-US | fr-CA | fr-FR | is-IS | it-IT | ja-JP | hi-IN | ko-KR | nb-NO | nl-NL | pl-PL | pt-BR | pt-PT | ro-RO | ru-RU | sv-SE | tr-TR | en-NZ | en-ZA | ca-ES | de-AT | yue-CN | ar-AE | fi-FI | en-IE | nl-BE | fr-BE

Obrigatório: não

LexiconNames

Lista de um ou mais nomes de léxico de pronúncia que você deseja que o serviço aplique durante a síntese. O léxico só será aplicado ao texto se o idioma especificado nele for o mesmo que o da voz.

Tipo: matriz de strings

Membros da matriz: número máximo de 5 itens.

Padrão: [0-9A-Za-z]{1,20}

Obrigatório: não

OutputFormat

O formato no qual a saída retornada será codificada. Para transmissão de áudio, será MP3, ogg_vorbis ou pcm. Marcas de fala serão JSON.

Tipo: sequências

Valores Válidos: json | mp3 | ogg_vorbis | pcm

Obrigatório: Sim

OutputS3BucketName

Nome do bucket do Amazon S3 no qual o arquivo de saída será salvo.

Tipo: string

Padrão: ^[a-z0-9][\.\-a-z0-9]{1,61}[a-z0-9]$

Exigido: Sim

OutputS3KeyPrefix

Prefixo das chaves do Amazon S3 para o arquivo de fala de saída.

Tipo: string

Padrão: ^[0-9a-zA-Z\/\!\-_\.\*\'\(\):;\$@=+\,\?&]{0,800}$

Obrigatório: não

SampleRate

A frequência de áudio especificada em Hz.

Os valores válidos para MP3 e ogg_vorbis são 8000, 16000, 22050 e 24000. O valor padrão para vozes padrão é 22050. O valor padrão para vozes neurais é 24000. O valor padrão para vozes em formato longo é “24.000”. O valor padrão para vozes generativas é “24000".

Os valores válidos para pcm são 8000 e 16000. O valor padrão é 16000.

Tipo: sequência

Obrigatório: não

SnsTopicArn

O ARN do tópico do SNS é usado opcionalmente para fornecer notificação de status para uma tarefa de síntese de fala.

Tipo: string

Padrão: ^arn:aws(-(cn|iso(-b)?|us-gov))?:sns:[a-z0-9_-]{1,50}:\d{12}:[a-zA-Z0-9_-]{1,251}([a-zA-Z0-9_-]{0,5}|\.fifo)$

Obrigatório: não

SpeechMarkTypes

Tipo de marcas de fala retornadas para o texto de entrada.

Tipo: matriz de strings

Membros da matriz: número máximo de 4 itens.

Valores Válidos: sentence | ssml | viseme | word

Obrigatório: não

Text

Texto de entrada a ser sintetizado. Se você especificar ssml como o TextType, siga o formato SSML para o texto de entrada.

Tipo: string

Obrigatório: Sim

TextType

Especifica se o texto de entrada é simples ou SSML. O valor padrão é texto sem formatação.

Tipo: sequências

Valores Válidos: ssml | text

Obrigatório: não

VoiceId

ID de voz a ser usado para a síntese.

Tipo: sequências

Valores Válidos: Aditi | Amy | Astrid | Bianca | Brian | Camila | Carla | Carmen | Celine | Chantal | Conchita | Cristiano | Dora | Emma | Enrique | Ewa | Filiz | Gabrielle | Geraint | Giorgio | Gwyneth | Hans | Ines | Ivy | Jacek | Jan | Joanna | Joey | Justin | Karl | Kendra | Kevin | Kimberly | Lea | Liv | Lotte | Lucia | Lupe | Mads | Maja | Marlene | Mathieu | Matthew | Maxim | Mia | Miguel | Mizuki | Naja | Nicole | Olivia | Penelope | Raveena | Ricardo | Ruben | Russell | Salli | Seoyeon | Takumi | Tatyana | Vicki | Vitoria | Zeina | Zhiyu | Aria | Ayanda | Arlet | Hannah | Arthur | Daniel | Liam | Pedro | Kajal | Hiujin | Laura | Elin | Ida | Suvi | Ola | Hala | Andres | Sergio | Remi | Adriano | Thiago | Ruth | Stephen | Kazuha | Tomoko | Niamh | Sofie | Lisa | Isabelle | Zayd | Danielle | Gregory | Burcu

Exigido: Sim

Sintaxe da Resposta

HTTP/1.1 200 Content-type: application/json { "SynthesisTask": { "CreationTime": number, "Engine": "string", "LanguageCode": "string", "LexiconNames": [ "string" ], "OutputFormat": "string", "OutputUri": "string", "RequestCharacters": number, "SampleRate": "string", "SnsTopicArn": "string", "SpeechMarkTypes": [ "string" ], "TaskId": "string", "TaskStatus": "string", "TaskStatusReason": "string", "TextType": "string", "VoiceId": "string" } }

Elementos de Resposta

Se a ação for bem-sucedida, o serviço retornará uma resposta HTTP 200.

Os dados a seguir são retornados no formato JSON pelo serviço.

SynthesisTask

SynthesisTask objeto que fornece informações e atributos sobre uma tarefa de síntese de fala recém-enviada.

Tipo: objeto SynthesisTask

Erros

EngineNotSupportedException

Esse mecanismo não é compatível com a voz que você designou. Escolha uma nova voz compatível com o mecanismo ou troque-o e reinicie a operação.

Código de Status HTTP: 400

InvalidS3BucketException

O nome do bucket do Amazon S3 fornecido é inválido. Verifique a entrada com os requisitos de nomenclatura do bucket do S3 e tente novamente.

Código de Status HTTP: 400

InvalidS3KeyException

O prefixo das chaves do Amazon S3 fornecido é inválido. Forneça um nome de chave de objeto S3 válido.

Código de Status HTTP: 400

InvalidSampleRateException

A taxa de amostragem especificada é inválida.

Código de Status HTTP: 400

InvalidSnsTopicArnException

O ARN do tópico SNS fornecido é inválido. Forneça um ARN de tópico de SNS válido e tente novamente.

Código de Status HTTP: 400

InvalidSsmlException

O SSML fornecido é inválido. Verifique a sintaxe do SSML, a ortografia e valores das tags tente novamente.

Código de Status HTTP: 400

LanguageNotSupportedException

O idioma especificado não é compatível com o Amazon Polly nessa capacidade.

Código de Status HTTP: 400

LexiconNotFoundException

O Amazon Polly não encontrou o léxico especificado. Isso pode ser causado por um léxico inexistente, pelo nome escrito incorretamente ou pela especificação de um léxico que está em uma região diferente.

Verifique se o léxico existe, se está na região (consulte ListLexicons) e se o nome dele está escrito corretamente. Tente novamente.

Código de Status HTTP: 404

MarksNotSupportedForFormatException

As marcas de fala não são compatíveis com o OutputFormat selecionado. As marcas de fala estão disponíveis apenas para conteúdo em formato json.

Código de Status HTTP: 400

ServiceFailureException

Uma condição desconhecida causou uma falha no serviço.

Código de Status HTTP: 500

SsmlMarksNotSupportedForTextTypeException

As marcas de fala SSML não são compatíveis com a entrada de texto sem formatação.

Código de Status HTTP: 400

TextLengthExceededException

O valor do parâmetro Texto é maior que os limites aceitos. Para a API do SynthesizeSpeech, o limite para texto de entrada é de no máximo 6 mil caracteres, dos quais não mais do que 3 mil podem ser faturados. Para a API StartSpeechSynthesisTask, o máximo é de 200 mil caracteres, dos quais não mais do que 100 mil podem ser faturados. Tags SSML não são contadas como caracteres cobrados.

Código de Status HTTP: 400

Consulte também

Para obter mais informações sobre como usar essa API em um dos AWS SDKs específicos da linguagem, consulte o seguinte: