Anforderungssyntax URI-Anfrageparameter Anforderungstext Antwortsyntax Antwortelemente Fehler Weitere Informationen finden Sie unter:

StartSpeechSynthesisTask

Ermöglicht die Erstellung einer asynchronen Synthesetask, indem eine neue SpeechSynthesisTask gestartet wird. Dieser Vorgang erfordert alle Standardinformationen, die für die Sprachsynthese benötigt werden, sowie den Namen eines Amazon S3 S3-Buckets, in dem der Service die Ausgabe der Synthese-Aufgabe speichert, und zwei optionale Parameter (OutputS3KeyPrefixundSnsTopicArn). Sobald die Syntheseaufgabe erstellt wurde, gibt dieser Vorgang ein SpeechSynthesisTask Objekt zurück, das eine Kennung dieser Aufgabe sowie den aktuellen Status enthält. Das SpeechSynthesisTask Objekt ist nach dem Start der asynchronen Syntheseaufgabe 72 Stunden lang verfügbar.

Anforderungssyntax


POST /v1/synthesisTasks HTTP/1.1
Content-type: application/json

{
   "Engine": "string",
   "LanguageCode": "string",
   "LexiconNames": [ "string" ],
   "OutputFormat": "string",
   "OutputS3BucketName": "string",
   "OutputS3KeyPrefix": "string",
   "SampleRate": "string",
   "SnsTopicArn": "string",
   "SpeechMarkTypes": [ "string" ],
   "Text": "string",
   "TextType": "string",
   "VoiceId": "string"
}

URI-Anfrageparameter

Die Anforderung verwendet keine URI-Parameter.

Anforderungstext

Die Anforderung akzeptiert die folgenden Daten im JSON-Format.

Engine

Gibt die Engine (standard, long-form odergenerative) anneural, die Amazon Polly bei der Verarbeitung von Eingabetext für die Sprachsynthese verwenden soll. Die Verwendung einer Stimme, die für die gewählte Engine nicht unterstützt wird, führt zu einem Fehler.

Typ: Zeichenfolge

Zulässige Werte: standard | neural | long-form | generative

Erforderlich: Nein

LanguageCode

Optionaler Sprachcode für die Sprachsynthese-Anfrage. Dies ist nur erforderlich, wenn Sie eine zweisprachige Stimme wie Aditi verwenden, die entweder für indisches Englisch (en-IN) oder Hindi (Hi-in) verwendet werden kann.

Wenn eine zweisprachige Stimme verwendet wird und kein Sprachcode angegeben ist, verwendet Amazon Polly die Standardsprache der zweisprachigen Stimme. Die Standardsprache für jede Stimme ist die Sprache, die bei der Operation für den DescribeVoicesParameter zurückgegeben wurde. LanguageCode Wenn beispielsweise kein Sprachcode angegeben ist, verwendet Aditi indisches Englisch statt Hindi.

Typ: Zeichenfolge

Erforderlich: Nein

LexiconNames

Liste mit einem oder mehreren Aussprache-Lexikonnamen, die der Dienst bei der Synthese anwenden soll. Lexika werden nur angewendet, wenn die Sprache des Lexikons mit der Sprache der Stimme übereinstimmt.

Typ: Zeichenfolgen-Array

Array-Mitglieder: Maximale Anzahl von 5 Elementen.

Pattern: [0-9A-Za-z]{1,20}

Erforderlich: Nein

OutputFormat

Das Format, in dem die zurückgegebene Ausgabe codiert wird. Für Audiostreams ist dies mp3, ogg_vorbis, ogg_opus, mu-law, a-law oder pcm. Bei Sprachzeichen ist dies json.

Typ: Zeichenfolge

Erforderlich: Ja

OutputS3BucketName

Name des Amazon S3 S3-Buckets, in dem die Ausgabedatei gespeichert wird.

Typ: Zeichenfolge

Pattern: ^[a-z0-9][\.\-a-z0-9]{1,61}[a-z0-9]$

Erforderlich: Ja

OutputS3KeyPrefix

Das Amazon S3 S3-Schlüsselpräfix für die Sprachausgabedatei.

Typ: Zeichenfolge

Pattern: ^[0-9a-zA-Z\/\!\-_\.\*\':;\$@=+\,\?&]{0,800}$

Erforderlich: Nein

SampleRate

Die in Hz angegebene Audiofrequenz.

Die gültigen Werte für mp3 und ogg_vorbis sind „8000", „16000", „22050" und „24000". Der Standardwert für Standardstimmen ist „22050". Der Standardwert für neuronale Stimmen ist „24000". Der Standardwert für Stimmen in Langform ist „24000". Der Standardwert für generative Stimmen ist „24000".

Gültige Werte für pcm sind „8000" und „16000". Der Standardwert ist „16000".

Der gültige Wert für ogg_opus ist „48000".

Der gültige Wert für mu-law und a-law ist „8000".

Typ: Zeichenfolge

Erforderlich: Nein

SnsTopicArn

ARN für das SNS-Thema, das optional für die Bereitstellung von Statusbenachrichtigungen für eine Sprachsyntheseaufgabe verwendet wird.

Typ: Zeichenfolge

Pattern: ^arn:aws(-(cn|iso(-b)?|us-gov))?:sns:[a-z0-9_-]{1,50}:\d{12}:[a-zA-Z0-9_-]{1,251}([a-zA-Z0-9_-]{0,5}|\.fifo)$

Erforderlich: Nein

SpeechMarkTypes

Der Typ der Sprachzeichen, die für den Eingabetext zurückgegeben wurden.

Typ: Zeichenfolgen-Array

Array-Mitglieder: Maximale Anzahl von 4 Elementen.

Zulässige Werte: sentence | ssml | viseme | word

Erforderlich: Nein

Text

Der zu synthetisierende Eingabetext. Wenn Sie ssml als angeben TextType, folgen Sie dem SSML-Format für den Eingabetext.

Typ: Zeichenfolge

Erforderlich: Ja

TextType

Gibt an, ob der Eingabetext Klartext oder SSML ist. Der Standardwert ist Klartext.

Typ: Zeichenfolge

Zulässige Werte: ssml | text

Erforderlich: Nein

VoiceId

Sprach-ID, die für die Synthese verwendet werden soll.

Typ: Zeichenfolge

Erforderlich: Ja

Antwortsyntax


HTTP/1.1 200
Content-type: application/json

{
   "SynthesisTask": { 
      "CreationTime": number,
      "Engine": "string",
      "LanguageCode": "string",
      "LexiconNames": [ "string" ],
      "OutputFormat": "string",
      "OutputUri": "string",
      "RequestCharacters": number,
      "SampleRate": "string",
      "SnsTopicArn": "string",
      "SpeechMarkTypes": [ "string" ],
      "TaskId": "string",
      "TaskStatus": "string",
      "TaskStatusReason": "string",
      "TextType": "string",
      "VoiceId": "string"
   }
}

Antwortelemente

Wenn die Aktion erfolgreich ist, sendet der Service eine HTTP 200-Antwort zurück.

Die folgenden Daten werden vom Service im JSON-Format zurückgegeben.

SynthesisTask

SynthesisTask Objekt, das Informationen und Attribute zu einer neu eingereichten Sprachsyntheseaufgabe bereitstellt.

Typ: SynthesisTask Objekt

Fehler

EngineNotSupportedException

Diese Engine ist mit der von Ihnen angegebenen Stimme nicht kompatibel. Wählen Sie eine neue Stimme, die mit der Engine kompatibel ist, oder wechseln Sie die Engine und starten Sie den Vorgang erneut.

HTTP-Statuscode: 400

InvalidS3BucketException

Der angegebene Amazon S3 S3-Bucket-Name ist ungültig. Bitte überprüfen Sie Ihre Eingabe mit den Anforderungen für die Benennung von S3-Buckets und versuchen Sie es erneut.

HTTP-Statuscode: 400

InvalidS3KeyException

Das angegebene Amazon S3 S3-Schlüsselpräfix ist ungültig. Bitte geben Sie einen gültigen S3-Objektschlüsselnamen an.

HTTP-Statuscode: 400

InvalidSampleRateException

Die angegebene Samplerate ist nicht gültig.

HTTP-Statuscode: 400

InvalidSnsTopicArnException

Der angegebene ARN für das SNS-Thema ist ungültig. Bitte geben Sie einen gültigen SNS-Thema-ARN ein und versuchen Sie es erneut.

HTTP-Statuscode: 400

InvalidSsmlException

Die von Ihnen angegebene SSML ist ungültig. Überprüfen Sie die SSML-Syntax sowie die Schreibweise der Tags und Werte, und versuchen Sie es erneut.

HTTP-Statuscode: 400

LanguageNotSupportedException

Die angegebene Sprache wird derzeit von Amazon Polly in dieser Funktion nicht unterstützt.

HTTP-Statuscode: 400

LexiconNotFoundException

Amazon Polly kann das angegebene Lexikon nicht finden. Dies kann durch ein fehlendes Lexikon, durch einen falsch geschriebenen Namen oder durch die Angabe eines Lexikons in einer anderen Region verursacht werden.

Vergewissern Sie sich, dass das Lexikon existiert, sich in der Region befindet (sieheListLexicons) und ob Sie den Namen richtig geschrieben haben. Versuchen Sie es dann erneut.

HTTP-Statuscode: 404

MarksNotSupportedForFormatException

Sprachzeichen werden für die OutputFormat ausgewählten Elemente nicht unterstützt. Sprachzeichen sind nur für Inhalte im json Format verfügbar.

HTTP-Statuscode: 400

ServiceFailureException

Ein unbekannter Zustand hat zu einem Dienstausfall geführt.

HTTP Status Code: 500

SsmlMarksNotSupportedForTextTypeException

SSML-Sprachzeichen werden für Klartexteingaben nicht unterstützt.

HTTP-Statuscode: 400

TextLengthExceededException

Der Wert des Parameters „Text“ ist länger als die akzeptierten Grenzwerte. Für die SynthesizeSpeech API beträgt das Limit für Eingabetext insgesamt maximal 6000 Zeichen, von denen nicht mehr als 3000 fakturierte Zeichen sein können. Für die StartSpeechSynthesisTask API liegt das Maximum bei 200.000 Zeichen, wovon nicht mehr als 100.000 fakturierte Zeichen sein können. SSML-Tags werden nicht als berechnete Zeichen gezählt.

HTTP-Statuscode: 400

Weitere Informationen finden Sie unter:

Weitere Informationen zur Verwendung dieser API in einer der sprachspezifischen Sprachen finden Sie im AWS SDKs Folgenden:

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

StartSpeechSynthesisStream

SynthesizeSpeech