Sprechen - Amazon Chime SDK

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Sprechen

Sie können Sprache auf jedem Anruf-Leg spielen, indem Sie Text angeben. Sie können Klartext oder Speech Synthesis Markup Language (SSML) verwenden. SSML bietet mehr Kontrolle darüber, wie Amazon Chime Sprache generiert, indem Pausen hinzugefügt, bestimmte Wörter hervorgehoben oder den Sprechstil geändert werden.

Amazon Chime verwendet den Amazon Polly Service, um Text in Speech zu konvertieren. Amazon Polly ermöglicht es Ihnen, entweder zwischen Standard- oder Neuralmotor zu wählen, um die Sprachqualität zu verbessern. Amazon Polly unterstützt mehr als 20 Sprachen und 60 Stimmen, um die Benutzererfahrung Ihrer Anwendung anzupassen. Amazon Chime bietet kostenlos Sprachfunktionen, aber Sie bezahlen für die Verwendung von Amazon Polly. Sehen Sie Amazon PollyPreisseiteoder Ihr Abrechnungs-Dashboard für Preisinformationen.

Wichtig

Die Verwendung von Amazon Polly unterliegt derAWS-Servicebedingungen, einschließlich der Begriffe für die AWS Machine Learning und Artificial Intelligence Services.

Verwenden der Aktion „Sprechen“

Das folgende Beispiel zeigt eine typische Verwendung desSpeakAktion

{ "SchemaVersion": "1.0", "Actions":[ { "Type": "Speak", "Parameters": { "Text": "Hello, World!", // required "CallId": "call-id-1", // required "Engine": "neural", // optional. Defaults to standard "LanguageCode": "en-US", // optional "TextType": "text", // optional "VoiceId": "Joanna" // optional. Defaults to Joanna } } ] }
CalLid

Beschreibung— DieCallIddes Teilnehmers derCallDetailsdes Aufrufs der Lambda-Funktion

Zulässige Werte- Eine gültige Anruf-ID

Erforderlich— Yes

Standardwert – Keine

Text

Beschreibung— Gibt den Eingabetext an, der in Sprache synthetisiert werden soll. Wenn Sie angebenssmlwie derTextTypefolgen Sie dem SSML-Format für den Eingabetext.

Zulässige Werte– Zeichenfolge

Erforderlich— Yes

Standardwert – Keine

Engine

Beschreibung— Gibt den Motor - Standard oder Neural - an, der bei der Verarbeitung von Text für die Sprachsynthese verwendet werden soll.

Zulässige Werte— Standard | neuronale

Erforderlich— Nein

Standardwert— standard

LanguageCode

Beschreibung— Gibt den Sprachcode an. Nur notwendig, wenn Sie eine zweisprachige Stimme verwenden. Wenn Sie eine zweisprachige Stimme ohne Sprachcode verwenden, wird die Standardsprache der zweisprachigen Stimme verwendet.

Zulässige WerteAmazon Polly Sprachcodes

Erforderlich— Nein

Standardwert – Keine

TextType

Beschreibung— Gibt den Typ von Eingabetext, Nur-Text oder SSML an. Wenn kein Eingabetyp angegeben wird, wird Nur-Text als Standard verwendet. Weitere Informationen zu SSML finden Sie unterGenerieren von Sprachausgaben aus SSML-DokumentenimAmazon Polly Developer Guideaus.

Zulässige Werte— ssml | text

Erforderlich— Nein

Standardwert – Keine

VoiceID

Beschreibung— Gibt die ID der zu verwendenden Stimme an.

Zulässige WerteAmazon Polly Sprachkennungen

Erforderlich— Nein

Standardwert— Joanna

Umgang mit ACTION_SUCCESS Ereign

Das folgende Beispiel zeigt einen typischenACTION_SUCCESSFULEreignis für eine Aktion, die den Text „Hello World“ unter Verwendung der Amazon Polly's in Sprache synthetisiertJoannaStimme.

{ "SchemaVersion": "1.0", "Sequence": 3, "InvocationEventType": "ACTION_SUCCESSFUL", "ActionData": { "Type": "Speak", "Parameters": { "CallId": "call-id-1", "Engine": "neural", "LanguageCode": "en-US", "Text": "Hello World", "TextType": "text", "VoiceId": "Joanna" } }, "CallDetails":{ ... } }

Umgang mit ACTION_FAILED Ereignissen

Das folgende Beispiel zeigt einen typischenACTION_FAILED-Ereignis für dasselbe Ereignis, das im vorherigen Beispiel verwendet wurde.

{ "SchemaVersion": "1.0", "Sequence":2, "InvocationEventType": "ACTION_FAILED", "ActionData":{ "Type": "Speak", "Parameters": { "CallId": "call-id-1", "Engine": "neural", "LanguageCode": "en-US", "Text": "Hello World", "TextType": "text", "VoiceId": "Joanna" }, "ErrorType": "SystemException", "ErrorMessage": "System error while running action" }, "CallDetails":{ ... } }

Fehlerbehandlung

In dieser Tabelle werden die Fehlermeldungen aufgelistet und beschrieben, die vomSpeakAktion

Fehler

Fehlermeldung

Grund

AccessDenied

DieAWSServiceRoleForAmazonChimeVoiceConnectorDie serviceverknüpfte Rolle ist nicht korrekt konfiguriert.

Die serviceverknüpfte Rolle, die verwendet wird, um Anfragen an Amazon Polly zu stellen, existiert nicht oder es fehlen Genehmigungen. Um dies zu beheben, lesen Sie die Schritte imVerwenden der serviceverknüpften Amazon Chime Voice Connector-RolleAbschnitt

InvalidActionParameter

 

Beim Validieren der Aktionsparameter ist ein Fehler aufgetreten. Sehen Sie sich dasAPI SynthesizeSpeechimAmazon Polly Developer Guidefür weitere Informationen über Parameter.

ActionExecutionThrottled Amazon Polly drosselt die -Sprachsynthese. Die Anfrage an Amazon Polly gibt eine Drosselungsausnahme zurück. Weitere Informationen zu den Grenzwerten für Amazon Polly für die Drosselung finden Sie unterhttps://docs.aws.amazon.com/polly/latest/dg/limits.html#limits-throttleaus.

MissingRequiredActionParameter

Textist ein erforderlicher Parameter.

Dort müssen Aktionsparameter eineTextWert

MissingRequiredActionParameter

Textist auf 1.000 Zeichen beschränkt

Der Text hat die Zeichengrenze überschritten.

SystemException

Systemfehler beim Ausführen der Aktion.

Beim Ausführen der Aktion ist ein Systemfehler aufgetreten.

Programmflüsse

Das folgende Diagramm zeigt den Programmfluss, bei demSpeakAktion für einen Anrufer. In diesem Beispiel hört der Anrufer Text, der


    Diagramm mit dem Programmablauf zum Aktivieren desSpeakAktion für einen Anrufer.

Im Diagramm

Mit einem Softphone gibt ein Anrufer eine Nummer ein, die für eine SIP-Medienanwendung registriert ist. Die Anwendung verwendet das SIPINVITEMethode und sendet dem Anrufer einTrying (100)antwort. Dies zeigt an, dass der Next-Hop-Server die Anrufanforderung erhalten hat. Die SIP-Anwendung verwendet dannINVITEum den Endpunkt zu kontaktieren. Sobald die Verbindung hergestellt wurde, senden die AnwendungenRinging (180)Reaktion auf den Anrufer und die Warnung beginnt.

Die SIP-Medienanwendung sendet dann eineNEW_INBOUND_CALLEreignis auf die Lambda-Funktion, die mit einemSpeakAktion, die die ID des Anrufers und den Text enthält, den Sie in Sprache konvertieren möchten. Die SIP-Anwendung sendet dann eine200 (OK)Antwort, um anzuzeigen, dass der Anruf beantwortet wurde. Das Protokoll ermöglicht auch die Medien.

Wenn das SymbolSpeakAktion ist erfolgreich und wandelt den Text in Sprache um, es gibt einACTION_SUCCESSFUL-Ereignis an die SIP-Medienanwendung, die den nächsten Satz von Aktionen zurückgibt. Wenn die Aktion fehlschlägt, sendet die SIP-Medienanwendung eineACTION_FAILEDEreignis auf die Lambda-Funktion, die mit einer Reihe vonHangupAktionen. Die Anwendung legt den Anrufer auf und gibt einenHANGUPEreignis zur Lambda-Funktion, die keine weiteren Maßnahmen ergreift.

Das folgende Diagramm zeigt den Programmablauf, alsSpeakAktion für einen Angerufenen.


    Diagramm mit dem Programmablauf zum Aktivieren desSpeakAktion für einen Angerufenen. Sie können dies bei jedem überbrückten Anruf tun.

Im Diagramm

Ein Anrufer gibt eine Nummer ein, die für eine SIP-Medienanwendung registriert ist, und die Anwendung antwortet wie für das vorherige Diagramm beschrieben. Wenn die Lambda-Funktion denNEW_INBOUND_CALL-Ereignis, es gibt dieCallandBridgeAktion zur SIP-Anwendung. Die Anwendung verwendet dann das SIPINVITEMethode zum Senden desTrying (100)undRinging (180)Antworten auf den Angerufenen.

Wenn der Angerufene antwortet, erhält die SIP-Medienanwendung eine200 (OK)Antwort, und es sendet dieselbe Antwort an den Anrufer. Das etabliert Medien, und die SIP-Anwendung sendet eineACTION_SUCCESSFUL-Event für dieCallandBridgeAktion zur Lambda-Funktion. Die Funktion gibt dann die Speak-Aktion und Daten an die SIP-Anwendung zurück, die konvertiert