翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
スピーチマークの種類
SynthesizeSpeech または StartSpeechSynthesisTask コマンドのいずれかの SpeechMarkTypes オプションを使用して、スピーチマークをリクエストします。入力テキストから返すメタデータ要素を指定します。最大 4 種類のメタデータをリクエストできますが、リクエストごとに少なくとも 1 種類指定する必要があります。このリクエストで音声出力が生成されることはありません。
例えば、AWS CLI で、
--speech-mark-types='["sentence", "word", "viseme", "ssml"]'
Amazon Polly は、次の要素を使用してスピーチマークを生成します。
-
sentence (文) - 入力テキストで文の要素を示します。
-
word (単語) - 入力テキストで単語の要素を示します。
-
viseme (ビゼーム) - 話されている各音素に対応する顔と口の動きを表します。詳細については、「ビゼームと Amazon Polly」を参照してください。
-
ssml – SSML 入力テキストからの <mark> 要素を表します。詳細については、「SSML ドキュメントから音声を生成する」を参照してください。