Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

StartSpeechSynthesisTask

Modo de foco
StartSpeechSynthesisTask - Amazon Polly

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Permite a criação de uma tarefa de síntese assíncrona, iniciando uma nova SpeechSynthesisTask. Essa operação requer todas as informações padrão necessárias para a síntese de fala, além do nome de um bucket do Amazon S3 para que o serviço armazene a saída da tarefa de síntese e dois parâmetros opcionais (OutputS3KeyPrefix e SnsTopicArn). Depois que a tarefa de síntese for criada, a operação retornará um objeto de SpeechSynthesisTask que incluirá um identificador a tarefa e o status atual. O objeto SpeechSynthesisTask fica disponível por 72 horas após o início da tarefa de síntese assíncrona.

Sintaxe da Solicitação

POST /v1/synthesisTasks HTTP/1.1 Content-type: application/json { "Engine": "string", "LanguageCode": "string", "LexiconNames": [ "string" ], "OutputFormat": "string", "OutputS3BucketName": "string", "OutputS3KeyPrefix": "string", "SampleRate": "string", "SnsTopicArn": "string", "SpeechMarkTypes": [ "string" ], "Text": "string", "TextType": "string", "VoiceId": "string" }

Parâmetros da solicitação de URI

A solicitação não usa nenhum parâmetro de URI.

Corpo da Solicitação

A solicitação aceita os dados a seguir no formato JSON.

Engine

Especifica o mecanismo (standard, neural, long-form ou generative) que o Amazon Polly usará ao processar texto de entrada para a síntese de fala. Usar uma voz que não seja compatível com o mecanismo selecionado resultará em erro.

Tipo: string

Valores Válidos: standard | neural | long-form | generative

Obrigatório: não

LanguageCode

Código de idioma opcional para a solicitação de síntese de fala. É necessário apenas se estiver usando uma voz bilíngue, como Aditi, que pode ser usada para inglês indiano (en-IN) ou hindi (hi-IN).

Se uma voz bilíngue for usada e nenhum código de idioma for especificado, o Amazon Polly usará o idioma padrão da voz bilíngue. O idioma padrão para qualquer voz é aquele retornado pela DescribeVoicesoperação do LanguageCode parâmetro. Por exemplo, se nenhum código de idioma for especificado, Aditi usará inglês indiano em vez de hindi.

Tipo: string

Valores Válidos: arb | cmn-CN | cy-GB | da-DK | de-DE | en-AU | en-GB | en-GB-WLS | en-IN | en-US | es-ES | es-MX | es-US | fr-CA | fr-FR | is-IS | it-IT | ja-JP | hi-IN | ko-KR | nb-NO | nl-NL | pl-PL | pt-BR | pt-PT | ro-RO | ru-RU | sv-SE | tr-TR | en-NZ | en-ZA | ca-ES | de-AT | yue-CN | ar-AE | fi-FI | en-IE | nl-BE | fr-BE | cs-CZ | de-CH

Obrigatório: não

LexiconNames

Lista de um ou mais nomes de léxico de pronúncia que você deseja que o serviço aplique durante a síntese. O léxico só será aplicado ao texto se o idioma especificado nele for o mesmo que o da voz.

Tipo: matriz de strings

Membros da matriz: número máximo de 5 itens.

Padrão: [0-9A-Za-z]{1,20}

Obrigatório: não

OutputFormat

O formato no qual a saída retornada será codificada. Para transmissão de áudio, será MP3, ogg_vorbis ou pcm. Marcas de fala serão JSON.

Tipo: string

Valores Válidos: json | mp3 | ogg_vorbis | pcm

Obrigatório: sim

OutputS3BucketName

Nome do bucket do Amazon S3 no qual o arquivo de saída será salvo.

Tipo: string

Padrão: ^[a-z0-9][\.\-a-z0-9]{1,61}[a-z0-9]$

Exigido: Sim

OutputS3KeyPrefix

Prefixo das chaves do Amazon S3 para o arquivo de fala de saída.

Tipo: string

Padrão: ^[0-9a-zA-Z\/\!\-_\.\*\'\(\):;\$@=+\,\?&]{0,800}$

Obrigatório: não

SampleRate

A frequência de áudio especificada em Hz.

Os valores válidos para MP3 e ogg_vorbis são 8000, 16000, 22050 e 24000. O valor padrão para vozes padrão é 22050. O valor padrão para vozes neurais é 24000. O valor padrão para vozes em formato longo é “24.000”. O valor padrão para vozes generativas é “24000”.

Os valores válidos para pcm são 8000 e 16000. O valor padrão é 16000.

Tipo: String

Obrigatório: Não

SnsTopicArn

O ARN do tópico do SNS é usado opcionalmente para fornecer notificação de status para uma tarefa de síntese de fala.

Tipo: string

Padrão: ^arn:aws(-(cn|iso(-b)?|us-gov))?:sns:[a-z0-9_-]{1,50}:\d{12}:[a-zA-Z0-9_-]{1,251}([a-zA-Z0-9_-]{0,5}|\.fifo)$

Obrigatório: não

SpeechMarkTypes

Tipo de marcas de fala retornadas para o texto de entrada.

Tipo: matriz de strings

Membros da matriz: número máximo de 4 itens.

Valores Válidos: sentence | ssml | viseme | word

Obrigatório: não

Text

Texto de entrada a ser sintetizado. Se você especificar ssml como TextType, siga o formato SSML para o texto de entrada.

Tipo: string

Obrigatório: Sim

TextType

Especifica se o texto de entrada é simples ou SSML. O valor padrão é texto sem formatação.

Tipo: string

Valores Válidos: ssml | text

Obrigatório: não

VoiceId

ID de voz a ser usado para a síntese.

Tipo: string

Valores Válidos: Aditi | Amy | Astrid | Bianca | Brian | Camila | Carla | Carmen | Celine | Chantal | Conchita | Cristiano | Dora | Emma | Enrique | Ewa | Filiz | Gabrielle | Geraint | Giorgio | Gwyneth | Hans | Ines | Ivy | Jacek | Jan | Joanna | Joey | Justin | Karl | Kendra | Kevin | Kimberly | Lea | Liv | Lotte | Lucia | Lupe | Mads | Maja | Marlene | Mathieu | Matthew | Maxim | Mia | Miguel | Mizuki | Naja | Nicole | Olivia | Penelope | Raveena | Ricardo | Ruben | Russell | Salli | Seoyeon | Takumi | Tatyana | Vicki | Vitoria | Zeina | Zhiyu | Aria | Ayanda | Arlet | Hannah | Arthur | Daniel | Liam | Pedro | Kajal | Hiujin | Laura | Elin | Ida | Suvi | Ola | Hala | Andres | Sergio | Remi | Adriano | Thiago | Ruth | Stephen | Kazuha | Tomoko | Niamh | Sofie | Lisa | Isabelle | Zayd | Danielle | Gregory | Burcu | Jitka | Sabrina

Exigido: Sim

Sintaxe da Resposta

HTTP/1.1 200 Content-type: application/json { "SynthesisTask": { "CreationTime": number, "Engine": "string", "LanguageCode": "string", "LexiconNames": [ "string" ], "OutputFormat": "string", "OutputUri": "string", "RequestCharacters": number, "SampleRate": "string", "SnsTopicArn": "string", "SpeechMarkTypes": [ "string" ], "TaskId": "string", "TaskStatus": "string", "TaskStatusReason": "string", "TextType": "string", "VoiceId": "string" } }

Elementos de Resposta

Se a ação for bem-sucedida, o serviço retornará uma resposta HTTP 200.

Os dados a seguir são retornados no formato JSON pelo serviço.

SynthesisTask

SynthesisTask objeto que fornece informações e atributos sobre uma tarefa de síntese de fala recém-enviada.

Tipo: objeto SynthesisTask

Erros

EngineNotSupportedException

Esse mecanismo não é compatível com a voz que você designou. Escolha uma nova voz compatível com o mecanismo ou troque-o e reinicie a operação.

Código de status HTTP: 400

InvalidS3BucketException

O nome do bucket do Amazon S3 fornecido é inválido. Verifique a entrada com os requisitos de nomenclatura do bucket do S3 e tente novamente.

Código de status HTTP: 400

InvalidS3KeyException

O prefixo das chaves do Amazon S3 fornecido é inválido. Forneça um nome de chave de objeto S3 válido.

Código de status HTTP: 400

InvalidSampleRateException

A taxa de amostragem especificada é inválida.

Código de status HTTP: 400

InvalidSnsTopicArnException

O ARN do tópico SNS fornecido é inválido. Forneça um ARN de tópico de SNS válido e tente novamente.

Código de status HTTP: 400

InvalidSsmlException

O SSML fornecido é inválido. Verifique a sintaxe do SSML, a ortografia e valores das tags tente novamente.

Código de status HTTP: 400

LanguageNotSupportedException

O idioma especificado não é compatível com o Amazon Polly nessa capacidade.

Código de status HTTP: 400

LexiconNotFoundException

O Amazon Polly não encontrou o léxico especificado. Isso pode ser causado por um léxico inexistente, pelo nome escrito incorretamente ou pela especificação de um léxico que está em uma região diferente.

Verifique se o léxico existe, se está na região (consulte ListLexicons) e se o nome dele está escrito corretamente. Tente novamente.

Código de status HTTP: 404

MarksNotSupportedForFormatException

As marcas de fala não são compatíveis com o OutputFormat selecionado. As marcas de fala estão disponíveis apenas para conteúdo em formato json.

Código de status HTTP: 400

ServiceFailureException

Uma condição desconhecida causou uma falha no serviço.

Código de status HTTP: 500

SsmlMarksNotSupportedForTextTypeException

As marcas de fala SSML não são compatíveis com a entrada de texto sem formatação.

Código de status HTTP: 400

TextLengthExceededException

O valor do parâmetro Texto é maior que os limites aceitos. Para a API do SynthesizeSpeech, o limite para texto de entrada é de no máximo 6 mil caracteres, dos quais não mais do que 3 mil podem ser faturados. Para a API StartSpeechSynthesisTask, o máximo é de 200 mil caracteres, dos quais não mais do que 100 mil podem ser faturados. Tags SSML não são contadas como caracteres cobrados.

Código de Status HTTP: 400

Consulte Também

Para obter mais informações sobre como usar essa API em uma linguagem específica AWS SDKs, consulte o seguinte:

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.