Amazon Polly
开发人员指南

什么是 Amazon Polly?

Amazon Polly 是一项云服务,可以将文本转化为逼真的语音。您可以使用 Amazon Polly 开发能提高参与度和可用性的应用程序。Amazon Polly 支持多种语言,并包含各种逼真的声音,因此您可以构建在多个位置工作的支持语音的应用程序,并为您的客户使用理想的语音。使用 Amazon Polly,您只需为合成的文本付费。您也可以免费缓存和重放 Amazon Polly 生成的语音。

此外,Amazon Polly 还包含许多神经文本到语音转换 (NTTS) 语音,通过新的机器学习方法为语音质量带来突破性的改进,从而为客户提供尽可能最自然的文本到语音的似人类的语音。神经 TTS 技术还支持播音员风格,专为新闻播报使用案例量身定制。

Amazon Polly 的常用案例包括但不限于移动应用程序(如新闻阅读器、游戏、电子学习平台)、视障人士辅助功能应用程序以及快速增长的物联网 (IoT) 细分市场。

Amazon Polly 经认证可用于 HIPAA(1996 年《健康保险可携性与责任法》)和支付卡行业数据安全标准 (PCI DSS) 的受监管工作负载。

使用 Amazon Polly 的一些好处包括:

  • 高质量 – Amazon Polly 提供新的神经 TTS 和一流的标准 TTS 技术,以合成发音精度极高的超自然语音(包括缩写、首字母缩略词扩展、日期/时间解释和同义词消歧)。

     

  • 低延迟 – Amazon Polly 确保快速响应,这使其能适用于低延迟使用案例(如对话系统)。

     

  • 支持多种语言和语音 – Amazon Polly 支持数十种语音语言,并为大多数语言提供男性和女性语音选项。神经 TTS 目前支持三种英国英语语音和八种美国英语语音。随着我们推出的神经语音越来越多,这个数字将继续增加。美国英语语音 Matthew 和 Joanna 也可以使用神经播音员风格,与专业新闻主播的发音十分相似。

     

  • 经济实惠 – Amazon Polly 的按需付费模式意味着没有设置成本。您可以从小规模开始,然后视应用程序的发展情况进行扩展。

     

  • 基于云的解决方案 – 设备上的 TTS 解决方案需要大量的计算资源,特别是 CPU 功率、RAM 和磁盘空间。这些可能增加平板电脑、智能手机等设备的开发成本和功耗。相比之下,在 AWS 云中完成 TTS 转换大大降低了对本地资源的需求。这样就能够以尽可能高的质量支持所有可用的语言和语音。此外,还可以立即向所有最终用户提供语音改进,并且不需要进行额外的设备更新。

您是 Amazon Polly 的新用户吗?

如果您是首次接触 Amazon Polly 服务的用户,我们建议您按列出的顺序阅读以下各节:

  1. Amazon Polly 的工作原理 – 本节介绍了您可以用来打造端到端体验的各种 Amazon Polly 输入和选项。

  2. Amazon Polly 入门 – 在本节中,您将设置账户并测试 Amazon Polly 语音合成。

  3. 示例应用程序 – 本节提供了可供您探索 Amazon Polly 的更多示例。