Amazon Polly
開発者ガイド

SSML ドキュメントから音声を生成する

Amazon Polly を使用して、プレーンテキストまたは音声合成マークアップ言語 (SSML) を使用したドキュメントから音声を生成できます。SSML 拡張のテキストを使用すれば、Amazon Polly を使用して入力したテキストから音声を生成する方法を詳細に制御することができます。

たとえば、テキスト内に長い一時停止時間を追加したり、話す速度やピッチを変更できます。その他のオプションには以下が含まれます。

  • 特定の単語やフレーズを強調する

  • 発音記号を使用する

  • 呼吸音を含む

  • ウィスパー

  • ニュースキャスターの話し方を使用します。

Amazon Polly でサポートされる SSML タグとその使用方法の詳細については、「サポートされている SSML タグ」を参照してください。

SSML を使用する場合、特別な処理が必要な予約文字がいくつかあります。これは、SSML がコードの一部としてこれらの文字を使用するためです。それらを使用するには、特定のエンティティを使用してエスケープします。詳細については、「SSML での予約文字」を参照してください。

Amazon Polly では、「音声合成マークアップ言語 (SSML) バージョン 1.1、W3C 勧告」で定義されている SSML マークアップタグのサブセットを使用して、このように制御できます。

SSML を使用するには、Amazon Polly コンソール、または AWS CLI を使用します。次のトピックでは、SSML を使用して音声を生成する方法および目的に正確に適合するように出力を制御する方法を説明します。