ステップ 3.2: AWS CLI を使用した実習の開始 - Amazon Polly

ステップ 3.2: AWS CLI を使用した実習の開始

ここでは、Amazon Polly により提供されている音声合成をテストできます。この実習では、サンプルテキストを渡すことにより SynthesizeSpeech オペレーションを呼び出します。生成された音声をファイルとして保存し、そのコンテンツを確認します。

  1. synthesize-speech AWS CLI コマンドを実行し、サンプルテキストを音声ファイル (hello.mp3) に合成します。

    次の AWS CLI の例は、Unix、Linux、および macOS 用にフォーマットされています。Windows の場合、各行の末尾にあるバックスラッシュ (\) Unix 連結文字をキャレット (^) に置き換え、入力テキストの前後には二重引用符 (") を使用し、内部タグには一重引用符 (') を使用します。

    aws polly synthesize-speech \ --output-format mp3 \ --voice-id Joanna \ --text 'Hello, my name is Joanna. I learned about the W3C on 10/3 of last year.' \ hello.mp3

    synthesize-speech の呼び出しで、合成に使用するサンプルテキスト、使用する音声 (以下のステップ 3 で説明する音声 ID を提供することにより)、出力形式を指定します。このコマンドは、生成された音声を hello.mp3 ファイルに保存します。

    MP3 ファイルに加えて、次の出力がコンソールに送信されます。

    { "ContentType": "audio/mpeg", "RequestCharacters": "71" }
  2. 生成された hello.mp3 ファイルを再生して、合成された音声を確認します。

  3. DescribeVoices オペレーションを使用することにより、使用可能な音声のリストを取得します。次の describe-voices AWS CLI コマンドを実行します。

    aws polly describe-voices

    これに応じて、Amazon Polly は使用可能なすべての音声のリストを返します。音声ごとに、各種メタデータ (音声 ID、言語コード、言語名、音声の性別) がレスポンスに示されます。レスポンスの例を次に示します。

    { "Voices": [ { "Gender": "Female", "Name": "Salli", "LanguageName": "US English", "Id": "Salli", "LanguageCode": "en-US" }, { "Gender": "Female", "Name": "Joanna", "LanguageName": "US English", "Id": "Joanna", "LanguageCode": "en-US" } ] }

    オプションで、言語コードを指定して、特定の言語の利用可能な音声を見つけることができます。Amazon Polly では多数の音声がサポートされています。次の例では、ブラジルポルトガル語のすべての音声がリストされます。

    aws polly describe-voices \ --language-code pt-BR

    言語コードのリストについては、「Amazon Polly でサポートされている言語」を参照してください。これらの言語コードは、W3C 言語識別タグ (言語名の ISO 639 コード-ISO 3166 国コード) です。たとえば、en-US (アメリカ英語)、en-GB (イギリス英語)、es-ES (スペイン語) などです。

    さらに、AWS CLI で help オプションを使用して、言語コードのリストを取得することもできます。

    aws polly describe-voices help