カスタム語彙 - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

カスタム語彙

カスタム語彙を追加して、1 つまたは複数の単語の文字起こし精度を向上させます。これらは通常、ブランド名や頭字語、固有名詞、 Amazon Transcribe が正しく表示されない単語など、ドメイン固有の用語です。

カスタム語彙は、サポートされているすべての言語で使用できます。カスタム語彙で使用できるのは、その言語の文字セットにリストされている文字だけであることに注意してください。

重要

Amazon Transcribeを使用する場合、お客様はご自身のデータの完全性について責任を負うものとします。機密情報、個人情報 (PII)、または保護対象の医療情報 (PHI) をカスタム語彙に入力しないでください。

カスタム語彙を作成する際の考慮事項

  • ごとに最大 100 個のカスタム語彙ファイルを含めることができます AWS アカウント

  • カスタム語彙のサイズは 50 KB に制限されます。

  • API を使用してカスタム語彙を作成する場合、語彙ファイルはテキスト (*.txt) 形式である必要があります。を使用する場合 AWS Management Console、語彙ファイルはテキスト (*.txt) 形式またはカンマ区切り値 (*.csv) 形式にすることができます。

  • カスタム語彙内の各エントリは 256 文字を超えることはできません。

  • カスタム語彙を使用するには、文字起こし AWS リージョン と同じ で作成されている必要があります。

ヒント

を使用してカスタム語彙をテストできます AWS Management Console。カスタム語彙を使用する準備ができたら、 にログインし AWS Management Console、リアルタイム文字起こし を選択し、カスタマイズ にスクロールし、カスタム語彙 をオンにして、ドロップダウンリストからカスタム語彙を選択します。次に [ストリーミングを開始する] を選択します。カスタム語彙のいくつかの単語をマイクに向かって話し、正しくレンダリングされるかどうかを確認します。

カスタム語彙テーブルとリスト

重要

リスト形式のカスタム語彙は廃止される予定です。新しいカスタム語彙を作成する場合は、テーブル形式を使用してください。

テーブルを使用すると、カスタム語彙内の単語の入出力に対するオプションがより多くなり、より詳細に制御できます。テーブルでは、出力を微調整できるように、複数のカテゴリ (Phrase and DisplayAs) を指定する必要があります。

リストには追加のオプションがないため、入力できるのは文字起こしに表示したいエントリのみで、スペースはすべてハイフンに置き換えます。

AWS Management Console、 AWS CLI、 AWS SDKs はすべて同じ方法でカスタム語彙テーブルを使用します。リストはメソッドごとに異なるため、メソッド間で正常に使用するために追加のフォーマットが必要になる場合があります。

詳細については、「テーブルを使用してカスタム語彙を作成する」および「リストを使用してカスタム語彙を作成する」を参照してください。

もう少し深く掘り下げて、カスタム語彙で Amazon Augmented AI を使用する方法を学ぶには、以下を参照してください。

カスタム語彙に固有の API オペレーション