スピーチマークの種類

SynthesizeSpeech または StartSpeechSynthesisTask コマンドのいずれかの SpeechMarkTypes オプションを使用して、スピーチマークをリクエストします。入力テキストから返すメタデータ要素を指定します。最大 4 種類のメタデータをリクエストできますが、リクエストごとに少なくとも 1 種類指定する必要があります。このリクエストで音声出力が生成されることはありません。

例えば、AWS CLI で、


--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly は、次の要素を使用してスピーチマークを生成します。

sentence (文) - 入力テキストで文の要素を示します。
word (単語) - 入力テキストで単語の要素を示します。
viseme (ビゼーム) - 話されている各音素に対応する顔と口の動きを表します。詳細については、「ビゼームと Amazon Polly」を参照してください。
ssml – SSML 入力テキストからの <mark> 要素を表します。詳細については、「SSML ドキュメントから音声を生成する」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

スピーチマーク

ビゼームと Amazon Polly