Sintassi della richiesta Parametri della richiesta URI:Corpo della richiesta Sintassi della risposta Elementi di risposta Errori Vedi anche

StartSpeechSynthesisTask

Consente la creazione di un'attività di sintesi asincrona, avviando un nuovo SpeechSynthesisTask. Questa operazione richiede tutte le informazioni standard necessarie per la sintesi vocale, oltre al nome di un bucket Amazon S3 affinché il servizio archivi l'output dell'attività di sintesi e due parametri opzionali (OutputS3KeyPrefix e SnsTopicArn). Una volta creata l'attività di sintesi, questa operazione restituirà un oggetto SpeechSynthesisTask, che includerà un identificatore di questa attività e lo stato corrente. L'oggetto SpeechSynthesisTask è disponibile per 72 ore dopo l'avvio dell'attività di sintesi asincrona.

Sintassi della richiesta


POST /v1/synthesisTasks HTTP/1.1
Content-type: application/json

{
   "Engine": "string",
   "LanguageCode": "string",
   "LexiconNames": [ "string" ],
   "OutputFormat": "string",
   "OutputS3BucketName": "string",
   "OutputS3KeyPrefix": "string",
   "SampleRate": "string",
   "SnsTopicArn": "string",
   "SpeechMarkTypes": [ "string" ],
   "Text": "string",
   "TextType": "string",
   "VoiceId": "string"
}

Parametri della richiesta URI:

La richiesta non utilizza parametri URI.

Corpo della richiesta

La richiesta accetta i seguenti dati in formato JSON.

Engine

Speciifica il motore (standard,neural, long-form orgenerative) per Amazon Polly da utilizzare durante l'elaborazione del testo di input per la sintesi vocale. Se si utilizza una voce non supportata per il motore selezionato, si verificherà un errore.

Tipo: String

Valori validi: standard | neural | long-form | generative

Campo obbligatorio: no

LanguageCode

Codice lingua facoltativo per la richiesta di sintesi vocale. Ciò è necessario solo se si utilizza una voce bilingue, come Aditi, che può essere utilizzata sia per l'inglese indiano (en-IN) che per l'hindi (hi-IN).

Se viene utilizzata una voce bilingue e non viene specificato alcun codice lingua, Amazon Polly utilizza la lingua predefinita della voce bilingue. La lingua predefinita per ogni voce è quella restituita dall'DescribeVoicesoperazione per il LanguageCode parametro. Ad esempio, se non viene specificato alcun codice di lingua, Aditi utilizzerà l'inglese indiano anziché l'hindi.

Tipo: String

Campo obbligatorio: no

LexiconNames

Elenco di uno o più nomi di lessico di pronuncia che si desidera applicare il servizio durante la sintesi. I lessici vengono applicati solo se la lingua del lessico corrisponde alla lingua della voce.

Tipo: array di stringhe

Membri della matrice: numero massimo di 5 elementi.

Modello: [0-9A-Za-z]{1,20}

Obbligatorio: no

OutputFormat

Il formato in cui verrà codificato l'output restituito. Per lo streaming audio, saranno mp3, ogg_vorbis, ogg_opus, mu-law, a-law o pcm. Per i segni vocali, questo sarà json.

Tipo: String

Valori validi: json | mp3 | ogg_opus | ogg_vorbis | pcm

Obbligatorio: sì

OutputS3BucketName

Nome del bucket Amazon S3 in cui viene salvato il file di output.

Tipo: stringa

Modello: ^[a-z0-9][\.\-a-z0-9]{1,61}[a-z0-9]$

Obbligatorio: sì

OutputS3KeyPrefix

Prefisso della chiave Amazon S3 per il file vocale di output.

Tipo: stringa

Modello: ^[0-9a-zA-Z\/\!\-_\.\*\':;\$@=+\,\?&]{0,800}$

Obbligatorio: no

SampleRate

La frequenza audio specificata in Hz.

I valori validi per mp3 e ogg_vorbis sono "8000", "16000", "22050" e "24000". Il valore predefinito per le voci standard è "22050". Il valore predefinito per le voci neurali è "24000". Il valore predefinito per le voci lunghe è «24000". Il valore predefinito per le voci generative è «24000".

I valori validi per pcm sono "8000" e "16000". Il valore predefinito è "16000".

Il valore valido per ogg_opus è «48000".

Il valore valido per mu-law e a-law è «8000".

▬Tipo: stringa

Obbligatorio: no

SnsTopicArn

ARN per l'argomento SNS utilizzato facoltativamente per la notifica di stato per un'attività di sintesi vocale.

Tipo: stringa

Modello: ^arn:aws(-(cn|iso(-b)?|us-gov))?:sns:[a-z0-9_-]{1,50}:\d{12}:[a-zA-Z0-9_-]{1,251}([a-zA-Z0-9_-]{0,5}|\.fifo)$

Obbligatorio: no

SpeechMarkTypes

Tipo di segni vocali restituiti per il testo di input.

Tipo: array di stringhe

Membri della matrice: numero massimo di 4 elementi.

Valori validi: sentence | ssml | viseme | word

Campo obbligatorio: no

Text

Testo di input da sintetizzare. Se specificate ssml come TextType, seguite il formato SSML per il testo di input.

Tipo: stringa

Obbligatorio: sì

TextType

Specifica se il testo di input è testo normale o SSML. Il valore di default è testo normale.

Tipo: String

Valori validi: ssml | text

Campo obbligatorio: no

VoiceId

ID vocale da utilizzare per la sintesi.

Tipo: String

Obbligatorio: sì

Sintassi della risposta


HTTP/1.1 200
Content-type: application/json

{
   "SynthesisTask": { 
      "CreationTime": number,
      "Engine": "string",
      "LanguageCode": "string",
      "LexiconNames": [ "string" ],
      "OutputFormat": "string",
      "OutputUri": "string",
      "RequestCharacters": number,
      "SampleRate": "string",
      "SnsTopicArn": "string",
      "SpeechMarkTypes": [ "string" ],
      "TaskId": "string",
      "TaskStatus": "string",
      "TaskStatusReason": "string",
      "TextType": "string",
      "VoiceId": "string"
   }
}

Elementi di risposta

Se l'operazione riesce, il servizio restituisce una risposta HTTP 200.

I dati seguenti vengono restituiti in formato JSON mediante il servizio.

SynthesisTask

SynthesisTask oggetto che fornisce informazioni e attributi su un compito di sintesi vocale appena inviato.

Tipo: oggetto SynthesisTask

Errori

EngineNotSupportedException

Questo motore non è compatibile con la voce designata. Scegli una nuova voce compatibile con il motore o cambia il motore e riavvia l'operazione.

Codice di stato HTTP: 400

InvalidS3BucketException

Il nome del bucket Amazon S3 non è valido. Controlla il tuo input con i requisiti di denominazione del S3 Bucket e riprova.

Codice di stato HTTP: 400

InvalidS3KeyException

Il prefisso della chiave Amazon S3 non è valido. Fornisci un nome chiave oggetto S3 valido.

Codice di stato HTTP: 400

InvalidSampleRateException

La frequenza di campionamento specificata non è valida.

Codice di stato HTTP: 400

InvalidSnsTopicArnException

L'ARN dell'argomento SNS fornito non è valido. Fornisci un ARN di argomento SNS valido e riprova.

Codice di stato HTTP: 400

InvalidSsmlException

L'SSML fornito non è valido. Verifica la sintassi SSML, l'ortografia dei tag e dei valori, quindi riprova.

Codice di stato HTTP: 400

LanguageNotSupportedException

La lingua specificata non è attualmente supportata da Amazon Polly in questa capacità.

Codice di stato HTTP: 400

LexiconNotFoundException

Amazon Polly non è in grado di individuare il lessico specificato. Ciò potrebbe essere causato da un lessico mancante, il suo nome è errato o specificando un lessico che si trova in una regione diversa.

Verificare che il lessico esista, sia nella regione (consulta ListLexicons) e che hai digitato il suo nome sia corretto. Allora try again.

Codice di stato HTTP: 404

MarksNotSupportedForFormatException

I contrassegni vocali non sono supportati per OutputFormat selezionato. I contrassegni vocali sono disponibili solo per il contenuto in formato json.

Codice di stato HTTP: 400

ServiceFailureException

Una condizione sconosciuta ha causato un errore di servizio.

Codice di stato HTTP: 500

SsmlMarksNotSupportedForTextTypeException

I contrassegni vocali SSML non sono supportati per l'input di tipo testo normale.

Codice di stato HTTP: 400

TextLengthExceededException

Il valore del parametro "Testo" è più lungo dei limiti accettati. Per il API SynthesizeSpeech, il limite per il testo di input è un massimo di 6000 caratteri totali, di cui non più di 3000 caratteri possono essere fatturati. Per il API StartSpeechSynthesisTask, il massimo è 200.000 caratteri, di cui non più di 100.000 caratteri possono essere fatturati. I tag SSML non vengono conteggiati come caratteri fatturati.

Codice di stato HTTP: 400

Vedi anche

Per ulteriori informazioni sull'utilizzo di questa API in una delle lingue specifiche AWS SDKs, consulta quanto segue:

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

StartSpeechSynthesisStream

SynthesizeSpeech