音声の速度 - Amazon Polly

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

音声の速度

音声によってわずかな違いがあるため、利用可能な各音声による発声速度はわずかに異なります。たとえば、米国英語の音声で「Mary had a little lamb.」と発声した場合の速度は、Ivy と Joanna は、Matthew よりわずかに速くなり、Joey よりかなり速くなります。

音声によって多様性が幅広く、そのバリエーションの度合いは読み上げられるテキストによって異なるため、Amazon Polly 音声で標準速度 (1 分あたりの単語数) を使用することはできません。ただし、を使用して、選択したテキストの読み上げにかかる時間を確認することができます。 SpeechMarks。Amazon Polly でスピーチマークを使用する方法については、スピーチマークを使用する を参照してください。

テキストの一部を読み上げるのにかかる概算時間を確認するには

  1. AWS CLI を開きます。

  2. 以下のコードを実行します (必要に応じて入力)。

    aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt
  3. オープン LengthOfTextTXT

テキストが「Mary had a little lamb,」の場合、Amazon Polly から返される結果の最後の数行は次のようになります。

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

最後のビゼーム (基本的に「lamb」の最後の文字の音) は、読み上げ開始から 1,082 ミリ秒後に始まります。これは音声の長さと厳密には異なりますが、近いために、音声の比較の基礎として使用できます。

音声速度を変更する

一部のアプリケーションでは、読み上げ速度の調整が必要な場合があります。音声速度の調整が必要な場合に備えて、Amazon Polly では SSML タグを使用して速度を変更する機能を用意しています。

例:

企業は、移民に本を読み上げるアプリケーションを作成しています。対象者は英語を話しますが、流暢であるとは言えません。この場合、アプリケーションの読み上げと同時に、対象者が理解できるように読み上げ速度を遅くすることを検討します。

Amazon Polly では、SSML の <prosody> タグを使用して音声速度を遅くすることができます。例を示します。

<speak> In some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

または

<speak> In some cases, it might help your audience to <prosody rate="slow">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>

Amazon Polly で SSML を使用する場合、2 種類の速度から選択することができます。

  • プリセット速度: x-slowslowmediumfastx-fast。上記の場合、各オプションの速度は、目的の音声に応じて、概算値を示します。medium オプションでは、通常の音声速度に設定されます。

  • n% の音声速度: 20% から 200% の間で、任意の音声速度 (%) を設定できます。このような場合は、正確に速度を選択できます。ただし、実際の音声速度は、選択した音声によって異なります。100% は、通常の音声速度とみなされます。

各オプションの速度は概算であり、選択した音声に依存するため、選択した音声をさまざまな速度でテストして、ニーズに正確に一致することを確認するようお勧めします。

prosody タグの効果を最大限に引き出す使用方法については、「音量、話す速度、ピッチを制御する 」を参照してください。