Amazon Polly
開発者ガイド

Amazon Polly における制限

Amazon Polly を使用する際に注意すべき制限を以下に示します。

サポートされているリージョン

Amazon Polly が利用可能な AWS リージョンのリストについては、アマゾン ウェブ サービス全般のリファレンス の「AWS リージョンとエンドポイント」を参照してください。

ニューラル音声は現在、次のリージョンでサポートされています。

  • 米国東部 (バージニア北部): us-east-1

  • 米国西部 (オレゴン): us-west-2

  • 欧州 (アイルランド): eu-west-1

これらのリージョンのエンドポイントとプロトコルは、標準音声に使用されるものと同じです。

スロットリング

  • アカウントごとのスロットルレート: 100 トランザクション (リクエストまたはオペレーション)/秒 (tps) で、バースト制限は 120 tps。

    アカウントあたりの同時接続: 90

  • オペレーションあたりのスロットルレート:

    オペレーション

    制限

    レキシコン

    DeleteLexicon

    PutLexicon

    GetLexicon

    ListLexicons

    これらのオペレーションによる 2 トランザクション/秒 (tps) はすべて結合されます。

    最大許容バーストは 4 tps です。

    音声

    DescribeVoices

    80 tps で、バースト制限は 100 tps

    SynthesizeSpeech

    標準音声: 80 tps、バースト制限は 100 tps

    ニューラル音声: 8 tps、バースト制限は 10 tps

    StartSpeechSynthesisTask

    標準音声: 10 tps、バースト制限は 12 tps

    ニューラル音声: 1 tps

    GetSynthesizeSpeechTask および ListSynthesizeSpeechTask

    組み合わせの最大許容は 10 tps

発音レキシコン

  • アカウントにつき最大 100 個のレキシコンを保存できます。

  • レキシコン名は、長さが最大 20 文字の英数字文字列です。

  • 各レキシコンのサイズは最大 4,000 文字です。(レキシコンのサイズが SynthesizeSpeech オペレーションのレイテンシーに影響することに注意してください。)

  • レキシコンの <phoneme> または <alias> は最大 100 文字と置き換えることができます。

レキシコンの使用については、「レキシコンの管理」を参照してください。

SynthesizeSpeech API オペレーション

SynthesizeSpeech API オペレーションの使用には、以下の制限が関連している点に注意してください。

  • 入力テキストのサイズは、最大 3000 課金対象文字 (合計 6000 文字) です。SSML タグは、課金対象文字としてカウントされません。

  • 入力テキストに適用する最大 5 個のレキシコンを指定できます。

  • 出力オーディオストリーム (合成) は 10 分に制限されています。これに達した後は、残りの音声はカットオフされます。

詳細については、「SynthesizeSpeech」を参照してください。

注記

SynthesizeSpeech API オペレーションのいくつかの制限は、StartSythensizeSpeechTask API を使用して回避することができます。詳細については、「長いオーディオファイルの作成」を参照してください。

SpeechSynthesisTask API オペレーション

StartSpeechSynthesisTaskGetSpeechSynthesisTask、および ListSpeechSynthesisTasks API オペレーションの使用には、以下の制限が関連している点に注意してください。

  • 入力テキストのサイズは、最大 100,000 課金対象文字 (合計 200,000 文字) です。SSML タグは、課金対象文字としてカウントされません。

  • 入力テキストに適用する最大 5 個のレキシコンを指定できます。

音声合成マークアップ言語 (SSML)

SSML の使用には、以下の制限が関連している点に注意してください。

  • <audio><lexicon><lookup>、および <voice> タグは、サポートされていません。

  • <break> エレメントは、それぞれ最大 10 秒の時間を指定できます。

  • <prosody> タグでは、-80% より小さいレート属性値はサポートされていません。

詳細については、「SSML ドキュメントから音声を生成する」を参照してください。