長いオーディオファイルの作成 - Amazon Polly

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

長いオーディオファイルの作成

大規模なテキストの TTS ファイルを作成するには、Amazon Polly の非同期の合成機能を使用します。これには 3 つの SpeechSynthesisTask API を使用します。

  • StartSpeechSynthesisTask: 新しい合成タスクを開始します。

  • GetSpeechSynthesisTask: 以前に送信された合成タスクの詳細を返します。

  • ListSpeechSynthesisTasks: 送信された合成タスクを一覧表示します。

SynthesizeSpeech オペレーションはほぼリアルタイムにオーディオを生成し、ほとんどの場合、レイテンシーは比較的わずかです。これを行う場合、このオペレーションで合成できるのは 3000 文字だけです。

Amazon Polly の非同期の合成機能は、ドキュメントが合成され返される方法を変更することにより、より大きなテキストドキュメントを処理するという課題を克服します。StartSpeechSynthesisTask を使用して入力テキストを送信することにより合成リクエストが行われた場合、Amazon Polly ではリクエストがキューに入れられ、システムリソースが利用可能になるとすぐに非同期で処理されます。Amazon Polly は作成されたスピーチまたはスピーチマークストリームを Amazon Simple Storage Service (Amazon S3) バケット (必須) に直接アップロードして、完了したファイルの可用性について SNS トピック (オプション) を通じて通知します。

このようにして、ほぼリアルタイムの処理を除くすべての機能で利用できる長さは、最大で請求可能な 100,000 文字 (または合計 200,000 文字) です。

このメソッドを使用してドキュメントを合成するには、オーディオファイルを保存できる書き込み可能な Amazon S3 バケットを用意する必要があります。オプションの SNS トピック ID を指定して音声の合成の準備が完了したときに通知を受け取ることができます。合成タスクが完了すると、Amazon Polly は、そのトピックにメッセージを発行します。合成タスクが成功しなかった場合、このメッセージには役立つエラー情報が含まれていることもあります。これを行うには、合成タスクを作成して、SNS トピックに発行できるユーザーを確認します。作成する方法の詳細と SNS トピックへのサブスクライブの詳細については、Amazon SNS ドキュメントを参照してください。

暗号化

必要に応じて出力ファイルを暗号化された形式で S3 バケットに保存できます。これを行うには、最強のブロック暗号の一つである、256 ビットの高度暗号化規格 (AES-256) を使用する Amazon S3 バケットの暗号化を有効にします。