カスタム語彙 - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

カスタム語彙

カスタム単語の入出力に対するオプションを使用すると、単語の入出力に対するオプションがより多くなり、より多く制御できます。これらは通常、ブランド名や頭字語、固有名詞、正しく表示されない単語など、ドメイン固有の用語です。Amazon Transcribe

カスタムボキャブラリは、サポートされているすべての言語で使用できます。カスタムボキャブラリで使用できるのは、使用する言語の文字セットにリストされている文字のみであることに注意してください

重要

使用時のデータの完全性については、お客様が責任を負うものとしますAmazon Transcribe。機密情報、個人情報 (PII)、または保護対象の医療情報 (PHI) をカスタム語彙に入力しないでください。

カスタム語彙を作成するときの考慮事項:

  • カスタム語彙のサイズは 100 のカスタム語彙のサイズを持つことができます。AWS アカウント

  • カスタム語彙のサイズは 50 KB に制限されます。

  • API を使用してカスタムボキャブラリを作成する場合、ボキャブラリファイルはテキスト (*.txt) 形式でなければなりません。を使用する場合AWS Management Console、ボキャブラリファイルはテキスト (*.txt) 形式でもカンマ区切り値 (*.csv) 形式でもかまいません。

  • カスタムボキャブラリーの各エントリは 256 文字を超えることはできません

  • カスタム語彙を使用するには、AWS リージョン文字起こしと同じ方法で作成されている必要があります。

ヒント

を使用してカスタムボキャブラリーをテストできますAWS Management Console。カスタム語彙を使用する準備ができたら、にログインして [リアルタイム文字起こし] を選択し、[カスタマイズ] までスクロールして [カスタム語彙] に切り替え、ドロップダウンリストからカスタム語彙を選択します。AWS Management Console次に、[ストリーミング開始] を選択します。カスタムボキャブラリーのいくつかの単語をマイクに向かって話して、正しく表示されるかどうかを確認します。

カスタム語彙表とリスト

重要

リスト形式のカスタムボキャブラリーは廃止されています。新しいカスタムボキャブラリーを作成する場合は、表形式を使用してください

表を使用すると、単語の入出力に対するオプションがより多くなり、より多く制御できます。テーブルでは、(Phrase, IPA, SoundsLike, and DisplayAs)出力を微調整できるように複数のカテゴリを指定する必要があります。

リストには追加のオプションがないため、トランスクリプトに表示したいエントリのみを入力して、すべてのスペースをハイフンに置き換えることができます。

AWS Management Console、AWS CLI、AWS SDK はすべて同じ方法でカスタム語彙テーブルを使用します。表は各手法で使用方法が異なるため、各手法で使用方法が異なるため、各手法で使用方法が異なるため、追加の書式設定が必要になる場合があります。

詳細については、表を使ったカスタムボキャブラリーの作成およびリストを使用してカスタム語彙を作成するを参照してください。

Amazon Augmented AI をカスタムボキャブラリで使用する方法についてもう少し詳しく知るには、以下を参照してください。

カスタム語彙に固有の API オペレーション