メニュー
Amazon Polly
開発者ガイド

Amazon Polly とは?

Amazon Polly はテキストをリアルなスピーチに変換するクラウドサービスです。Amazon Polly を使用して、エンゲージメントやアクセス性を高めるアプリケーションを開発できます。Amazon Polly では多様な言語がサポートされており、さまざまのリアルな音声が含まれています。そのため、お客様に最適なボイスを使用して、さまざまな場所で機能する音声対応アプリケーションを構築できます。Amazon Polly は、合成したテキスト分のみお支払いいただくだけで利用可能です。また、追加コストなしで、Amazon Polly が生成した音声をキャッシュして再生できます。

Amazon Polly の一般的なユースケースは、ニュースリーダー、ゲーム、e ラーニングプラットフォーム、視力が弱い方向けのアクセシビリティアプリケーション、および急速に成長している IoT 分野などですが、他にもいろいろあります。

Amazon Polly は、Payment Card Industry (PCI) Data Security Standard (DSS)、HIPAA  (Health Insurance Portability and Accountability Act of 1996)、または FedRAMP での使用には認定されていません。

Amazon Polly を使用するメリットの例を次に示します。

  • 高品質 – Amazon Polly はクラス最高のテキスト読み上げ (TTS) 技術を使用して、発音が非常に正確で自然な音声を合成します (略語、頭字語の展開、日付/時刻の変換、同形異義語の読み分けなどを含みます)。

     

  • 低レイテンシー – Amazon Polly は応答時間が早いため、ダイアログシステムなどの低レイテンシーなユースケースにおいても選択肢になります。

     

  • 多数の言語とボイスのポートフォリオをサポート – Amazon Polly では、多数のボイスおよび複数の言語がサポートされており、ほとんどの言語で男性と女性のボイスを選択できます。

     

  • コスト効率が良い – Amazon Polly は従量課金制であり、セットアップコストはかかりません。小規模で開始し、アプリケーションが大きくなるにつれてスケールアップできます。

     

  • クラウドベースのソリューション – デバイス上のテキスト読み上げソリューションは、膨大なコンピューティングリソース、特に CPU パワー、RAM、ディスク容量を必要とします。そのため、開発コストが高くなり、またタブレットやスマートフォンなどのデバイスの電力消費も高くなります。これに対して、クラウド上でテキスト読み上げ変換を実行すると、ローカルで必要なリソースが劇的に減ります。これにより、すべての利用可能な言語とボイスを可能な限りの最高品質でサポートできます。さらに、音声が改良されるとすぐにすべてのエンドユーザーが使用できるようになり、デバイスで追加更新する必要がありません。

Amazon Polly を初めてお使いになる方向けの情報

Amazon Polly サービスを初めて使用する方には、次のセクションを順を追って読むことをお勧めします。

  1. Amazon Polly: 仕組み – このセクションでは、エンドツーエンドエクスペリエンスを作成するために使用できるさまざまな Amazon Polly の入力とオプションを紹介します。

  2. Amazon Polly の使用開始 – このセクションでは、アカウントをセットアップして Amazon Polly の音声合成をテストします。

  3. アプリケーション例 – このセクションでは、Amazon Polly の学習に使用できるその他の例を示します。