Amazon Polly の仕組み - Amazon Polly

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Polly の仕組み

Amazon Polly は入力テキストを肉声に近い音声に変換します。いずれかの音声合成メソッドを呼び出して、合成するテキストを入力し、ニューラルテキスト読み上げ (NTTS) または標準のテキスト読み上げ (TTS) 音声を選択して音声出力形式を指定します。Amazon Polly により、入力されたテキストが高品質のスピーチ音声ストリームに合成されます。

  • 入力テキスト – 合成するテキストを入力します。Amazon Polly によって音声ストリームが返されます。プレーンテキストまたは音声合成マークアップ言語 (SSML) 形式で入力できます。SSML を使用すると、発音、ボリューム、ピッチ、話す速度など、音声のさまざまな要素を制御できます。詳細については、「SSML ドキュメントから音声を生成する」を参照してください。

     

  • 使用できる音声 – Amazon Polly には、バイリンガル音声 (英語とヒンディー語の両方) を含む言語と音声のポートフォリオが用意されています。ほとんどの言語で、男女両方の複数の音声から選択できます。音声合成タスクを起動するときに、音声 ID を指定すると、Amazon Polly がその音声を使用してテキストを音声に変換します。Amazon Polly は翻訳サービスではありません。合成音声はテキストと同じ言語になります。ただし、テキストが音声に指定された言語と異なる場合、数字で表される数値 (例えば、五十三 ではなく 53) は、テキストではなく音声の言語で合成されます。詳細については、Amazon Polly の音声を参照してください。

     

  • 出力形式 – Amazon Polly は合成音声を複数の形式で提供できます。必要に応じて音声形式を選択できます。たとえば、ウェブやモバイルアプリケーション用に、MP3 や Ogg Vorbis 形式の音声をリクエストすることがあるかもしれません。または、AWS IoT デバイスやテレフォニーソリューション用に PCM 出力形式をリクエストする場合もあります。

次のステップ

初めて Amazon Polly を使用する場合は、以下のトピックを順番に参照することをお勧めします。