スピーチマークの種類 - Amazon Polly

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

スピーチマークの種類

SynthesizeSpeech または StartSpeechSynthesisTask コマンドのいずれかの SpeechMarkTypes オプションを使用して、スピーチマークをリクエストします。入力テキストから返すメタデータ要素を指定します。最大 4 種類のメタデータをリクエストできますが、リクエストごとに少なくとも 1 種類指定する必要があります。このリクエストで音声出力が生成されることはありません。

例えば、AWS CLI で、

--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly は、次の要素を使用してスピーチマークを生成します。

  • sentence (文) - 入力テキストで文の要素を示します。

  • word (単語) - 入力テキストで単語の要素を示します。

  • viseme (ビゼーム) - 話されている各音素に対応する顔と口の動きを表します。詳細については、「ビゼームと Amazon Polly」を参照してください。

  • ssml – SSML 入力テキストからの <mark> 要素を表します。詳細については、「SSML ドキュメントから音声を生成する」を参照してください。