CreateVocabularyFilter - Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

CreateVocabularyFilter

新しいカスタム語彙フィルターを作成します。

カスタムボキャブラリーフィルターを使用して、トランスクリプトから特定の単語を隠したり、削除したり、フラグを付けたりできます。カスタムボキャブラリーフィルターは、トランスクリプト内の冒とく的な表現を隠すためによく使用されます。

各言語には、その特定の言語で使用できるすべての文字を含む文字セットがあります。サポートされていない文字を使用すると、カスタムボキャブラリフィルターのリクエストは失敗します。カスタムボキャブラリの文字セットを参照して、ご使用の言語の文字セットを確認してください。

詳細については、[語彙フィルタリング] を参照してください。

リクエストの構文

{ "LanguageCode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "VocabularyFilterFileUri": "string", "VocabularyFilterName": "string", "Words": [ "string" ] }

リクエストパラメータ

すべてのアクションに共通のパラメータの詳細については、「共通パラメータ」を参照してください。

リクエストは以下の JSON 形式のデータを受け入れます。

LanguageCode

ボキャブラリーフィルターのエントリの言語を表す言語コード。各カスタム語彙フィルターには、1 つの言語の用語のみを含める必要があります。

カスタムボキャブラリーフィルターは、フィルターと同じ言語でファイルを転記する場合にのみ使用できます。たとえば、US English (en-US) を使用してカスタム語彙フィルターを作成した場合、このフィルターは英語の音声を含むファイルにのみ適用できます。

サポートされる言語とそれに関連する言語コードのリストについては、「サポートされる言語」の表を参照してください。

タイプ: 文字列

有効な値: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

必須: はい

Tags

この新しいボキャブラリーフィルターの作成時に、キーと値のペア形式で 1 つ以上のカスタムタグを新しいカスタムボキャブラリーフィルターに追加します。

Amazon Transcribe でのタグの使用については、「リソースをタグ付け」 を参照してください。

型: Tag オブジェクトの配列

配列メンバー: 最小数は 1 項目です。最大 200 項目。

必須: いいえ

VocabularyFilterFileUri

カスタムボキャブラリーフィルターの用語を含むテキストファイルの Amazon S3 の場所。URI は、AWS リージョン呼び出しているリソースと同じリソースに配置されている必要があります。

たとえば、のように。s3://DOC-EXAMPLE-BUCKET/my-vocab-filter-file.txt

VocabularyFilterFileUriリクエストに含めると、使用できないことに注意してくださいWords。どちらか一方を選択する必要があります。

タイプ: 文字列

長さの制限: 最小長は 1 です。最大長は 2,000 です。

パターン: (s3://|http(s*)://).+

必須: いいえ

VocabularyFilterName

新しいカスタムボキャブラリーフィルター用に自分で選んだユニークな名前。

この名前は大文字と小文字が区別され、スペースを含めることはできません。また、内では一意でなければなりませんAWS アカウント。既存のカスタムボキャブラリーフィルターと同じ名前の新しいカスタムボキャブラリーフィルターを作成しようとすると、ConflictExceptionエラーが表示されます。

タイプ: 文字列

長さの制限: 最小長は 1 です。最大長は 200 です。

パターン: ^[0-9a-zA-Z._-]+

必須: はい

Words

このパラメーターは、必要なすべての用語をカンマ区切りの値としてリクエストに含めてカスタムボキャブラリーフィルターを作成する場合に使用します。語彙フィルターを作成するもう 1 つの方法は、エントリをテキストファイルに保存して Amazon S3 バケットにアップロードし、VocabularyFilterFileUriパラメータを使用してファイルの場所を指定することです。

Wordsリクエストに含めると、使用できないことに注意してくださいVocabularyFilterFileUri。どちらか一方を選択する必要があります。

各言語には、その特定の言語で使用できるすべての文字を含む文字セットがあります。サポートされていない文字を使用すると、カスタムボキャブラリフィルターのリクエストは失敗します。カスタムボキャブラリの文字セットを参照して、ご使用の言語の文字セットを確認してください。

型: 文字列の配列

配列メンバー: 最小数は 1 項目です。

長さの制限: 最小長は 1 です。最大長は 256 です。

必須: いいえ

レスポンスの構文

{ "LanguageCode": "string", "LastModifiedTime": number, "VocabularyFilterName": "string" }

レスポンス要素

アクションが成功すると、サービスは HTTP 200 レスポンスを返します。

サービスから以下のデータが JSON 形式で返されます。

LanguageCode

カスタムボキャブラリーフィルター用に選択した言語コード。

タイプ: 文字列

有効な値: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

LastModifiedTime

カスタムボキャブラリーフィルターを作成した日時。

YYYY-MM-DD'T'HH:MM:SS.SSSSSS-UTCタイムスタンプは次の形式です。たとえば、2022-05-04T12:32:58.761000-07:00は 2022 年 5 月 4 日の午後 12 時 32 分 (UTC-7) を表します。

型: タイムスタンプ

VocabularyFilterName

カスタムボキャブラリーフィルターに選択した名前。

タイプ: 文字列

長さの制限: 最小長は 1 です。最大長は 200 です。

Pattern: ^[0-9a-zA-Z._-]+

エラー

すべてのアクションに共通のエラーについては、「共通エラー」を参照してください。

BadRequestException

リクエストは 1 つ以上の検証テストに合格しませんでした。削除しようとしているエンティティが存在しない場合、または非終端状態IN PROGRESS (のようにします。詳細については、例外のMessage フィールドを参照してください。

HTTP ステータスコード: 400

ConflictException

この名前のリソースは既に存在します。リソース名は内で一意である必要がありますAWS アカウント。

HTTP ステータスコード: 400

InternalFailureException

インターナルエラーが発生しました。エラーメッセージを確認して、問題を修正して、リクエストを再度試みてください。

HTTP ステータスコード: 500

LimitExceededException

送信されたリクエストが多すぎるか、または入力ファイルが長すぎます。リクエストを再度試みるか、より小さなファイルを使用してリクエストを再度試みてください。

HTTP ステータスコード: 400

以下の資料も参照してください。

言語固有の AWS SDK のいずれかでこの API を使用する方法の詳細については、以下を参照してください。