翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ステップ 2.2: AWS CLI を使用した実習の開始
ここでは、Amazon Polly により提供されている音声合成をテストできます。この実習では、サンプルテキストを渡すことにより SynthesizeSpeech
オペレーションを呼び出します。生成された音声をファイルとして保存し、そのコンテンツを確認します。
-
synthesize-speech
AWS CLI コマンドを実行し、サンプルテキストを音声ファイル (hello.mp3
) に合成します。次の AWS CLI の例は、Unix、Linux、および macOS 用にフォーマットされています。Windows の場合は、各行末のバックスラッシュ (\) Unix 連結文字をカレット (^) に置き換え、入力テキストは二重引用符 (") で囲み、内部タグは一重引用符 (') で囲みます。
aws polly synthesize-speech \ --output-format mp3 \ --voice-id Joanna \ --text 'Hello, my name is Joanna. I learned about the W3C on 10/3 of last year.' \ hello.mp3
synthesize-speech
の呼び出しで、合成に使用するサンプルテキスト、使用する音声 (以下のステップ 3 で説明する音声 ID を提供することにより)、出力形式を指定します。このコマンドは、生成された音声をhello.mp3
ファイルに保存します。MP3 ファイルに加えて、次の出力がコンソールに送信されます。
{ "ContentType": "audio/mpeg", "RequestCharacters": "71" }
-
生成された
hello.mp3
ファイルを再生して、合成された音声を確認します。 -
DescribeVoices
オペレーションを使用することにより、使用可能な音声のリストを取得します。次のdescribe-voices
AWS CLI コマンドを実行します。aws polly describe-voices
これに応じて、Amazon Polly は使用可能なすべての音声のリストを返します。音声ごとに、各種メタデータ (音声 ID、言語コード、言語名、音声の性別) がレスポンスに示されます。レスポンスの例を次に示します。
{ "Voices": [ { "Gender": "Female", "Name": "Salli", "LanguageName": "US English", "Id": "Salli", "LanguageCode": "en-US", "SupportedEngines": [ "neural", "standard" ] }, { "Gender": "Female", "Name": "Danielle", "LanguageName": "US English", "Id": "Danielle", "LanguageCode": "en-US", "SupportedEngines": [ "long-form" ] } ] }
オプションで、言語コードを指定して、特定の言語の利用可能な音声を見つけることができます。Amazon Polly では多数の音声がサポートされています。次の例では、ブラジルポルトガル語のすべての音声がリストされます。
aws polly describe-voices \ --language-code pt-BR
言語コードのリストについては、「Amazon Polly でサポートされている言語」を参照してください。これらの言語コードは、W3C 言語識別タグ (
言語名の ISO 639 コード
-ISO 3166 国コード
) です。たとえば、en-US (アメリカ英語)、en-GB (イギリス英語)、es-ES (スペイン語) などです。さらに、AWS CLI で
help
オプションを使用して、言語コードのリストを取得することもできます。aws polly describe-voices help