生成式語音

Amazon Polly 的生成文字text-to-speech(TTS) 引擎提供最人性化、情感參與和適應性的對話語音，可透過 Amazon Polly 主控台使用。

生成式引擎是迄今為止最大的 Amazon Polly TTS 模型。它會部署十億參數轉換器，將原始文字轉換為語音碼，然後部署以卷積為基礎的解碼器，以增量、可串流的方式將這些語音碼轉換為波形。此方法顯示大型語言模型 (LLMs) 在訓練越來越多的公開可用和專屬資料時廣泛報告的緊急功能，包括各種語音、語言和風格。

生成式引擎會建立合成語音，以與人類語音非常相似的方式，以情感參與、自信和高度共通。您可以使用這些語音做為知識淵博的客戶助理、虛擬訓練師，或具有近乎人類合成語音的廣告商。

注意

以這些語音為基礎的state-of-the-art技術位於生成式 AI 語言和語音建模的模式內。技術的副作用是，任何訓練資料和模型的更新都可能導致聲音聲音聲音方式的些微變化，即使整體品質隨著模型更新而改善。這可能會影響長時間合成不同內容組件的使用案例，例如播客季節。

可用的生成語音

Amazon Polly 目前在生成變體中提供 27 個語音。這些生成語音也可用於對話式 NTTS 變體。

	語言	語言代碼	名稱/ID	Gender
1	英文 (澳洲)	en-AU	奧利維亞	女性
2	英文 (印度)	en-IN	卡加爾文	女性
3	英文（南非）	en-ZA	Ayanda	女性
4	英文（英國）	en-GB	Amy	女性
5	英文 (美國)	zh-TW	丹尼爾文 Joanna Matthew Ruth Salli Stephen	女性女性男性女性女性男性
6	法文（比利時）	fr-BE	伊薩貝爾	女性
7	法文 (加拿大)	fr-CA	加布里爾 Liam	女性男性
8	法文（法國）	fr-FR	Céline Léa Rémi	女性女性男性
9	德文（德國）	de-DE	丹尼爾 Vicki	男性女性
10	義大利文（義大利）	it-IT	Bianca	女性
11	波蘭文（波蘭）	pl-PL	Ewa 奧拉	女性女性
12	西班牙文（墨西哥）	es-MX	安德列 Mía	男性女性
13	西班牙文（西班牙）	es-ES	Lucia Sergio	女性男性
14	西班牙文（美國）	es-US	Lupe Pedro	女性男性

注意

生成語音成本會在 Amazon Polly 定價資訊頁面上指定。

功能和區域相容性

Amazon Polly 生成語音可在下列區域使用：

美國東部 (維吉尼亞北部)：us-east-1
歐洲（法蘭克福）：eu-central-1
美國西部 (奧勒岡)：us-west-2
其他區域無法使用

生成語音支援下列功能：

即時和非同步語音合成操作。
生成式引擎不支援新聞播報員說話風格。
Amazon Polly 支援許多（但非全部） SSML 標籤。如需 NTTS 支援的 SSML 標籤的詳細資訊，請參閱支援的 SSML 標籤
如同標準語音，您可以從各種取樣率中選擇，為您的應用程式最佳化頻寬和音訊品質。標準和神經語音的有效取樣率為 8 kHz、16 kHz、22 kHz 或 24 kHz。標準語音的預設值為 22 kHz。生成語音的預設值為 24 kHz。Amazon Polly 支援 MP3、OGG (Vorbis) 和原始 PCM 音訊串流格式。

目前無法支援產生語音標記。

注意

在極少數的模型幻覺情況下，（以及隨著生成式引擎透過權杖轉譯語音權杖的模型行為）會實施強制執行的緊急停止機制。內建機制會阻止模型進一步轉譯語音。此安全功能是以資料分析為基礎，其中模型可能幻覺，通常是在句子結尾。

在某些情況下，模型可能會認為它會幻覺，然後在產生步驟期間最終剪下字詞，因此轉譯一半的字詞。這可能會產生不適當的結果。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

語音引擎

長型引擎