Sprachgeschwindigkeit - Amazon Polly

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Sprachgeschwindigkeit

Aufgrund der natürlichen Variation zwischen den Stimmen spricht jede verfügbare Stimme mit leicht unterschiedlichen Geschwindigkeiten. Zum Beispiel sind Ivy und Joanna mit US-englischen Stimmen etwas schneller als Matthew und erheblich schneller als Joey. Da es so viele Unterschiede zwischen den Stimmen gibt, ist für Amazon Polly Polly-Stimmen keine Standardgeschwindigkeit (Wörter pro Minute) verfügbar. Sie können jedoch mithilfe von Sprachmarken herausfinden, wie lange es dauert, bis Ihre Stimme den ausgewählten Text sagt.

Um die Länge einer gesprochenen Textpassage zu messen
  1. Öffne das AWS CLI.

  2. Führen Sie den folgenden Code aus und füllen Sie ihn nach Bedarf aus.

    aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt
  3. Öffnen Sie LengthOfText.txt.

Wenn der Text „Mary hatte ein kleines Lamm“ lauten würde, wären die letzten Zeilen, die Amazon Polly zurückgibt, wie folgt:

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

Das letzte Mundbild, d. h. der Klang der letzten Buchstaben in „lamb“, beginnt 1082 Millisekunden nach dem Beginn der Sprachausgabe. Dies ist zwar nicht genau die Länge des Audiomaterials, kommt dem jedoch ziemlich nahe und dient als Grundlage für den Vergleich zwischen Stimmen.

Ändern Sie Ihre Sprachgeschwindigkeit

Bei bestimmten Anwendungen stellen Sie möglicherweise fest, dass Ihnen die Stimme langsamer oder schneller besser gefallen würde. Wenn die Geschwindigkeit der Stimme ein Problem darstellt, bietet Amazon Polly die Möglichkeit, dies mithilfe von SSML-Tags zu ändern. Wenn Ihre Organisation beispielsweise eine Anwendung entwickelt hat, mit der Bücher für ein Publikum mit Migrationshintergrund vorgelesen werden, möchten Sie möglicherweise die Sprachgeschwindigkeit variieren. Ihr Publikum spricht zwar Englisch, aber seine Sprachkenntnisse sind begrenzt. <prosody>Amazon Polly hilft Ihnen dabei, die Sprechgeschwindigkeit mithilfe des SSML-Tags zu verlangsamen.

Sie können einen Prozentsatz verwenden:

<speak> In some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

Oder eine voreingestellte Geschwindigkeit:

<speak> In some cases, it might help your audience to <prosody rate="slow">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

Bei der Verwendung von SSML mit Amazon Polly stehen Ihnen zwei Geschwindigkeitsoptionen zur Verfügung:

  • Voreingestellte Geschwindigkeiten:x-slow,slow, mediumfast, und. x-fast In diesen Fällen handelt es sich bei der Geschwindigkeit der jeweiligen Option je nach bevorzugter Stimme um einen geschätzten Wert. Die medium-Option ist die normale Sprechgeschwindigkeit.

  • n% der Sprachgeschwindigkeit: Es kann ein beliebiger Prozentsatz der Sprachgeschwindigkeit zwischen 20 und 200% verwendet werden. In diesen Fällen können Sie genau die gewünschte Geschwindigkeit wählen. Die tatsächliche Geschwindigkeit der Stimme ist jedoch ein ungefährer Wert, abhängig von der ausgewählten Stimme. 100% wird als normale Geschwindigkeit der Stimme angesehen.

Anmerkung

Testen Sie die von Ihnen gewählte Stimme mit verschiedenen Geschwindigkeiten. Die Geschwindigkeit jeder Option ist eine ungefähre Angabe und hängt von der ausgewählten Stimme ab.

Weitere Informationen zur Verwendung des prosody Tags finden Sie unterSteuerung von Lautstärke, Sprechgeschwindigkeit und Tonhöhe .