NTTS の話し方 - Amazon Polly

英語の翻訳が提供されている場合で、内容が矛盾する場合には、英語版がオリジナルとして取り扱われます。翻訳は機械翻訳により提供されています。

NTTS の話し方

人は、状況に応じて異なる話し方を使用します。たとえば、くだけた会話は、テレビやラジオのニュース放送の話し方とは大きく異なります。Amazon Polly が標準音声を使用して音声を合成する場合、連結方法を使用します。連結方法により、音声データベースに保存された短い音声スニペットをつなげて、可能な限り最適かつ自然な音声が生成されます。ただし、これらの音声の作成方法のため、異なる話し方を作成することはできません。

標準の連結合成に加えて、Amazon Polly では、ニューラルテクノロジーを使用して、音声を生成できます。ニューラル音声の生成には、シーケンス間モデルが使用されます。このモデルで生成される結果は、音声データ入力を使用して音声を形成し、出力シーケンスでの音声の位置も考慮します。その後、非常に自然な音声としてそのまま使用できます。または、特定の話し方に合わせてトレーニングし、その話し方に固有の特定部分にバリエーションと強調を加えることができます。

Amazon Polly には、ニュースキャスターと会話型という 2 つの話し方が用意されています。

ニュースキャスターの話し方では、ニューラルシステムを使用して、テレビやラジオのニュースキャスターの話し方で音声が生成されます。ニュースキャスタースタイルは、米国英語 (en-US) の Matthew と Joanna の音声、およびスペイン語 (es-US) の Lupe の音声で利用できます。

会話型の話し方では、ニューラルシステムを使用して、より親しみのある表現力豊かな会話型の話し方で音声が生成され、多くのユースケースに利用できます。会話型の話し方は、Matthew と Joanna の音声でのみ提供され、米国英語 (en-US) でのみ利用できます。