CreateVocabularyFilter - 轉錄

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

CreateVocabularyFilter

建立新的自訂字彙篩選。

您可以使用自訂字彙篩選器來遮罩、刪除或標記成績單中的特定字詞。自定義詞彙過濾器通常用於掩蓋成績單中的不雅用語。

每種語言都有一個字元集,其中包含該特定語言允許的所有字元。如果您使用不支援的字元,您的自訂字彙篩選要求會失敗。請參閱自訂字彙的字元集,以取得您所用語言的字元集。

若需詳細資訊,請參閱詞彙篩選

請求語法

{ "LanguageCode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "VocabularyFilterFileUri": "string", "VocabularyFilterName": "string", "Words": [ "string" ] }

請求參數

如需有關所有動作共用之參數的資訊,請參閱一般參數

請求接受採用 JSON 格式的下列資料。

LanguageCode

代表詞彙篩選器中項目語言的語言代碼。每個自訂字彙篩選器只能包含一種語言的字詞。

自訂字彙篩選器只能用來轉錄與篩選器相同語言的檔案。例如,如果您使用 US English (en-US) 建立自訂字彙篩選器,則只能將此篩選套用至包含英文音訊的檔案。

如需支援的語言及其相關語言代碼的清單,請參閱支援的語言表格。

類型:String

有效值: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

必要:是

Tags

在您建立此新詞彙篩選器時,將一個或多個自訂標記 (以 key: value 組的形式) 新增至新的自訂字彙篩選條件。

若要進一步了解有關使用標籤 Amazon Transcribe 的詳細資訊,請參閱標籤資源

類型:Tag 物件陣列

陣列成員:項目數下限為 1。項目數上限為 200。

必要:否

VocabularyFilterFileUri

文字檔的 Amazon S3 位置,其中包含您的自訂詞彙篩選條件。URI 必須位於與您呼叫的資源AWS 區域相同的位置。

範例如下:s3://DOC-EXAMPLE-BUCKET/my-vocab-filter-file.txt

請注意,如果您VocabularyFilterFileUri在請求中包含,則無法使用Words;您必須選擇其中一個。

類型:String

長度限制:長度下限為 1。長度上限為 2000。

模式:(s3://|http(s*)://).+

必要:否

VocabularyFilterName

一個由您選擇的唯一名稱,用於新的自定義詞彙過濾器。

此名稱區分大小寫,不能包含空格,且在AWS 帳戶. 如果您嘗試使用與現有自訂字彙篩選器相同名稱建立新的自訂詞彙篩選器,就會出現ConflictException錯誤訊息。

類型:String

長度限制:長度下限為 1。長度上限為 200。

模式:^[0-9a-zA-Z._-]+

必要:是

Words

如果您想要在請求中包含所有想要的詞彙 (以逗號分隔值) 來建立自訂詞彙篩選,請使用此參數。建立詞彙篩選器的另一個選項是將項目儲存在文字檔中,並將其上傳到 Amazon S3 儲存貯體,然後使用VocabularyFilterFileUri參數指定檔案的位置。

請注意,如果您Words在請求中包含,則無法使用VocabularyFilterFileUri;您必須選擇其中一個。

每種語言都有一個字元集,其中包含該特定語言允許的所有字元。如果您使用不支援的字元,您的自訂字彙篩選要求會失敗。請參閱自訂字彙的字元集,以取得您所用語言的字元集。

類型:字串陣列

陣列成員:項目數下限為 1。

長度限制:長度下限為 1。長度上限為 256。

必要:否

回應語法

{ "LanguageCode": "string", "LastModifiedTime": number, "VocabularyFilterName": "string" }

回應元素

如果動作成功,則服務傳回 HTTP 200 回應。

服務會傳回下列 JSON 格式的資料。

LanguageCode

您為自訂字彙篩選器選取的語言代碼。

類型:String

有效值: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

LastModifiedTime

您建立自訂字彙篩選條件的日期和時間。

時間戳記的格式為YYYY-MM-DD'T'HH:MM:SS.SSSSSS-UTC。例如,2022-05-04T12:32:58.761000-07:00代表二零二二年五月四日下午十二時三十二分。UTC-7

類型:Timestamp

VocabularyFilterName

您為自訂字彙篩選器選擇的名稱。

類型:String

長度限制:長度下限為 1。長度上限為 200。

模式:^[0-9a-zA-Z._-]+

錯誤

如需所有動作常見的錯誤相關資訊,請參閱常見錯誤

BadRequestException

您的要求未通過一或多個驗證測試。當您嘗試刪除的實體不存在或處於非終端狀態(例如IN PROGRESS)時,可能會發生這種情況。如需詳細資訊,請參閱例外訊息欄位。

HTTP 狀態碼:400

ConflictException

具有此名稱的資源已存在。資源名稱在內必須是唯一的AWS 帳戶。

HTTP 狀態碼:400

InternalFailureException

發生內部錯誤。檢查錯誤訊息,修正問題,然後再試一次。

HTTP 狀態碼:500

LimitExceededException

您可能傳送太多要求,或輸入檔案太長。請先等候再重試您的要求,或使用較小的檔案再試一次。

HTTP 狀態碼:400

另請參閱

如需在語言特定的 AWS 開發套件之一中使用此 API 的詳細資訊,請參閱下列說明: