Amazon Polly の仕組み

Amazon Polly は入力テキストを肉声に近い音声に変換します。Amazon Polly の音声を使用するには、音声エンジンを選択して、音声合成メソッドを呼び出し、合成するテキストを指定して、オーディオ出力形式を指定します。Amazon Polly により、入力されたテキストが高品質のスピーチ音声ストリームに合成されます。

入力テキスト – 合成するテキストを入力します。Amazon Polly によって音声ストリームが返されます。入力は、プレーンテキストまたは音声合成マークアップ言語 (SSML) 形式で提供できます。SSML を使用すると、発音、ボリューム、ピッチ、話す速度など、音声のさまざまな要素を制御できます。詳細については、「SSML ドキュメントからの音声の生成」を参照してください。
使用できる音声 – Amazon Polly には、バイリンガル音声 (英語とヒンディー語の両方) を含む言語と音声のポートフォリオが用意されています。ほとんどの言語で、男女両方の複数の音声から選択できます。音声合成タスクを起動するときに、音声 ID を指定すると、Amazon Polly がその音声を使用してテキストを音声に変換します。Amazon Polly は翻訳サービスではありません。合成音声はテキストと同じ言語になります。数値を使用した数字 (五十三ではなく 53 など) は、テキストではなく、音声の言語で合成されます。詳細については、Amazon Polly の音声を参照してください。
出力形式 – Amazon Polly は合成音声を複数の形式で提供できます。必要に応じて音声形式を選択できます。たとえば、ウェブやモバイルアプリケーション用に、MP3 や Ogg Vorbis 形式の音声をリクエストすることがあるかもしれません。または、 AWS IoT デバイスやテレフォニーソリューションで使用する PCM 出力形式をリクエストすることもできます。

注記

Amazon Polly の音声の例をブラウザで聴くには、Amazon Polly 製品の概要を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

Amazon Polly とは

利点