長いオーディオファイルの作成 (CLI) - Amazon Polly

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

長いオーディオファイルの作成 (CLI)

Amazon Polly の非同期の合成機能は、3 つの SpeechSynthesisTask API を使用して大量のテキストを操作します。

  • StartSpeechSynthesisTask: 新しい合成タスクを開始します。

  • GetSpeechSynthesisTask: 以前に送信された合成タスクの詳細を返します。

  • ListSpeechSynthesisTasks: 送信された合成タスクを一覧表示します。

大量のテキストの合成 (StartSpeechSynthesisTask)

リアルタイム SynthesizeSpeech で作成できるオーディオファイルよりも大きなオーディオファイルを作成する場合、StartSpeechSynthesisTask オペレーションを使用します。SynthesizeSpeech オペレーションに必要な引数に加えて、StartSpeechSynthesisTask には Amazon S3 バケットの名前も必要です。タスクに関するステータス通知を受信する場合、他の 2 つのオプションの引数 (出力ファイルのキープレフィックス、および SNS トピックの ARN) を指定することもできます。

  • OutputS3BucketName: 合成をアップロードする Amazon S3バケット の名前。このバケットは Amazon Polly サービスと同じリージョンで作成される必要があります。さらに、呼び出しに使用されている IAM ユーザーにはこのバケットへのアクセス権が必要です。[必須]

  • OutputS3KeyPrefix: 出力ファイルのキープレフィックス。お使いのバケット内のカスタムディレクトリのようなキーに出力音声ファイルを保存する場合は、このパラメータを使用します。[オプション]

  • SnsTopicArn: タスクのステータスに関する通知を受け取る場合に使用する SNS トピックの ARN。この SNS トピックは Amazon Polly サービスと同じリージョンで作成される必要があります。さらに、呼び出しに使用されている IAM ユーザーにはこのトピックへのアクセス権が必要です。[オプション]

例えば、次の例は、米国東部 (オハイオ) リージョンで start-speech-synthesis-task AWS CLI コマンドを実行するために使用できます。

次の AWS CLI の例は、Unix、Linux、および macOS 用にフォーマットされています。Windows の場合は、各行末のバックスラッシュ (\) Unix 連結文字をカレット (^) に置き換え、入力テキストは二重引用符 (") で囲み、内部タグは一重引用符 (') で囲みます。

aws polly start-speech-synthesis-task \ --region us-east-2 \ --endpoint-url "https://polly.us-east-2.amazonaws.com/" \ --output-format mp3 \ --output-s3-bucket-name your-bucket-name \ --output-s3-key-prefix optional/prefix/path/file \ --voice-id Joanna \ --text file://text_file.txt

これにより、次のような応答が得られます。

"SynthesisTask": { "OutputFormat": "mp3", "OutputUri": "https://s3.us-east-2.amazonaws.com/your-bucket-name/optional/prefix/path/file.<task_id>.mp3", "TextType": "text", "CreationTime": [..], "RequestCharacters": [..], "TaskStatus": "scheduled", "TaskId": [task_id], "VoiceId": "Joanna" }

start-speech-synthesis-task オペレーションは、複数の新しいフィールドを返します。

  • OutputUri: 出力音声ファイルの場所。

  • TaskId: Amazon Polly で生成された音声合成タスクの一意の識別子。

  • CreationTime: タスクが最初に送信された時刻のタイムスタンプ。

  • RequestCharacters: タスク内の請求可能な文字の数。

  • TaskStatus: 送信されたタスクのステータスに関する情報を提供します。

    タスクが送信されると、最初のステータス scheduled が表示されます。Amazon Polly がタスクの処理を開始すると、ステータスが inProgress に変わり、さらに completed または failed へと変化します。タスクが失敗した場合は、GetSpeechSynthesisTask または ListSpeechSynthesisTasks オペレーションを呼び出すときに、エラーメッセージが返されます。

タスクが完了すると、OutputUri で指定した場所で、音声ファイルが利用できます。

音声合成タスクの情報の取得

エラー、ステータスなどのタスクの情報を取得するには、GetSpeechSynthesisTask オペレーションを使用します。これを行うには、task-id によって返される StartSpeechSynthesisTask が必要です。

たとえば、次の例は、get-speech-synthesis-task AWS CLI コマンドを実行するために使用できます。

aws polly get-speech-synthesis-task \ --region us-east-2 \ --endpoint-url "https:// polly.us-east-2.amazonaws.com/" \ --task-id task identifier

ListSpeechSynthesisTasks オペレーションを使用して、現在のリージョンで実行したすべての音声合成タスクを一覧表示することもできます。

たとえば、次の例は、list-speech-synthesis-tasks AWS CLI コマンドを実行するために使用できます。

aws polly list-speech-synthesis-tasks \ --region us-east-2 \ --endpoint-url "https:// polly.us-east-2.amazonaws.com/"