Amazon Polly
開発者ガイド

スピーチマーク

スピーチマークは、合成する音声を表すメタデータです。たとえば、文章または単語が音声ストリームで開始し、終了する場合です。テキストのスピーチマークをリクエストすると、Amazon Polly は、合成された音声の代わりにこのメタデータを返します。合成されたスピーチ音声ストリームとスピーチマークを組み合わせて使用することで、高度なビジュアル体験を提供するアプリケーションを構築できます。

たとえば、テキストのメタデータと音声ストリームを組み合わせると、スピーチと表情アニメーション (リップシンキング) を同期したり、読み上げられたとおりに書かれた単語をハイライト表示したりできます。

スピーチマークは、ニューラル形式または標準のテキスト読み上げ形式を使用する場合に利用できます。