リストを使用してカスタム語彙を作成する - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

リストを使用してカスタム語彙を作成する

、、または AWS SDK を使用してリストからカスタムボキャブラリを作成できます。AWS Management Console AWS CLI

  • AWS Management Console: カスタムボキャブラリを含むテキストファイルを作成してアップロードする必要があります。行で区切られたエントリまたはカンマで区切られたエントリを使用できます。リストはテキスト (*.txt) ファイルとしてフォーマットして保存する必要があることに注意してください。LFなど、他の形式を使用した場合CRLF、カスタム語彙は受け入れられませんAmazon Transcribe。

  • AWS CLIおよび AWSSDK: フラグを使用して API 呼び出しにカスタム語彙をカンマで区切ったエントリとして含める必要があります。Phrases

エントリに複数の単語が含まれている場合は、各単語をハイフンでつなぐ必要があります。たとえば、「ロサンゼルス」を、「Los-Angelesアンドララベリャ」をとして含めます。Andorra-la-Vella

2 つの有効なリスト形式の例を次に示します。カスタム語彙リストの作成メソッド固有の例については、を参照してください。

  • カンマで区切られたエントリ:

    Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
  • 行で区切られたエントリ:

    Los-Angeles CLI Eva-Maria ABCs Andorra-la-Vella
重要

使用する言語でサポートされている文字のみを使用できます。詳細については、ご使用の言語の文字セットを参照してください

CreateMedicalVocabularyこの操作では、カスタム語彙リストはサポートされていません。カスタム医療用語を作成する場合は、表形式を使用する必要があります。テーブルを使用してカスタム語彙を作成する手順については、を参照してください。

カスタム語彙リストの作成

カスタムボキャブラリーリストを処理して使用するにはAmazon Transcribe、次の例を参照してください。

この例では、リスト形式のカスタム語彙ファイルで create-` コマンドを使用しています。詳細については、「CreateVocabulary」を参照してください。

aws transcribe create-vocabulary \ --vocabulary-name my-first-vocabulary \ --language-code en-US \ --phrases {CLI,Eva-Maria,ABCs}

ここでは、create-langualコマンドと、カスタム語彙を作成するリクエストボディを使用した別の例を示します

aws transcribe create-vocabulary \ --cli-input-json file://filepath/my-first-vocab-list.json

ファイル my-first-vocab-list.json に次のリクエストボディが入ります。

{ "VocabularyName": "my-first-vocabulary", "LanguageCode": "en-US", "Phrases": [ "CLI","Eva-Maria","ABCs" ] }

VocabularyStatePENDINGからに変更したらREADY、カスタムボキャブラリーを文字起こしで使用できるようになります。カスタム語彙の現在のステータスを表示するには、以下を実行します。

aws transcribe get-vocabulary \ --vocabulary-name my-first-vocabulary

この例では、AWS SDK for Python (Boto3)を使用して create_` メソッドを使用してリストからカスタムボキャブラリを作成します。詳細については、「CreateVocabulary」を参照してください。

機能固有の例、シナリオ、クロスサービスの例など、AWS SDK を使用するその他の例については、この章を参照してください。SDK を使用した Amazon Transcribe のコード例 AWS SDKs

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary" response = transcribe.create_vocabulary( LanguageCode = 'en-US', VocabularyName = vocab_name, Phrases = [ 'CLI','Eva-Maria','ABCs' ] ) while True: status = transcribe.get_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
注記

Amazon S3カスタムボキャブラリーファイル用に新しいバケットを作成する場合は、IAMCreateVocabularyリクエストを行うロールにこのバケットにアクセスする権限があることを確認してください。ロールに正しいアクセス許可がない場合、リクエストは失敗します。DataAccessRoleArnパラメータを含めることで、IAMリクエスト内のロールを任意で指定できます。IAMのロールとポリシーの詳細についてはAmazon Transcribe、を参照してくださいAmazon Transcribe アイデンティティベースポリシーの例