本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
添加自定义词汇表
通过在 Contact Lens 中扩展和定制speech-to-text引擎词汇表,您可以提高产品名称、品牌名称和特定领域术语的语音识别准确性。
本主题介绍如何使用 Amazon Connect 控制台添加自定义词汇表。您也可以使用CreateVocabulary和 AssociateDefaultVocabularyAPI 添加它们。
有关自定义词汇表需知信息
-
必须将词汇表设置为默认词汇表,才能将其应用于分析以生成记录。下图显示了自定义词汇表页面。选择省略号,然后选择 “设为默认值”。
-
您可以将每种语言一个词汇应用于分析。这意味着每种语言只能有一个文件处于 “就绪”(默认)状态。
-
您可以上传 20 多个词汇文件。但是,您只能同时激活 20 个自定义词汇表文件。
-
转录是一次性活动。新上传的词汇不会追溯应用于现有转录。
-
您的文本文件必须为 LF 格式。如果您使用任何其他格式,例如 CRLF 格式,Amazon Transcribe 不接受您的自定义词汇表。
-
仅当您选择英语设置时,才能下载示例词汇文件。
-
有关词汇文件大小的限制和其他要求,请参阅 Amazon Transcribe 开发者指南中的自定义词汇表。
-
自定义词汇表仅适用于语音分析。它们不适用于聊天对话,因为笔录已经存在。
所需的权限
在向 Amazon Connect 添加自定义词汇表之前,您需要为您的安全配置文件分配分析和优化、隐形眼镜-自定义词汇表权限。
默认情况下,在 Amazon Connect 的新实例中,管理员和CallCenterManager安全配置文件具有此权限。
有关如何向现有安全配置文件添加更多权限的信息,请参阅更新安全配置文件。
添加自定义词汇表
-
使用具有添加自定义词汇表所需权限的用户账户登录 Amazon Connect。
-
导航到 “分析和优化”,“自定义词汇表”。
-
选择 “添加自定义词汇”。
-
在添加自定义词汇表页面上,输入词汇的名称,选择英语,然后选择下载示例文件。
注意
仅当您选择英语设置时,才能下载示例词汇文件。否则,将显示一条错误消息,如下图中所示。
下图显示了示例词汇文件的样子。标题包含
Phrase
、IPA
、SoundsLike
、DisplayAs
。 标头是必需的。 -
文件中的信息由每个条目一个 [TAB] 分隔。有关如何向词汇文件中添加单词和首字母缩略词的详细信息,请参阅 Amazon Transcribe 开发者指南中的使用表格创建自定义词汇表。
下图显示了示例词汇文件中的单词。短语列中的单词为必填字词。
IPA
、SoundsLike
和DisplayAs
列中的单词是可选的。要在 “短语” 列中输入多个单词,请使用连字符 (-) 分隔每个单词;请勿使用空格。
词汇状态
-
就绪(默认):正在将词汇应用于分析以生成记录本。它适用于实时和通话后分析。
-
准备就绪:词汇表尚未应用于分析,但它是一个有效的文件并且可用。要将其应用于分析,请将其设置为默认值。
-
处理:Amazon Connect 正在验证您上传的词汇表,并尝试将其应用于分析以生成笔录。
-
删除:您选择了删除词汇表,Amazon Connect 现在正在将其删除。
Amazon Connect 删除词汇大约需要 90 分钟。
如果您尝试上传未验证的词汇,则会导致 “失败” 状态。例如,如果您向短语列添加多词短语,并使用空格而不是连字符将其分开,则会失败。
下载并查看自定义词汇表
要查看已上传的自定义词汇表,请下载并打开该文件。只能下载和查看处于 “就绪” 状态的文件。
-
导航到 “分析和优化”,“自定义词汇表”。
-
选择 “更多,下载”。下载的位置显示在下图中。
-
打开下载文件以查看内容。
-
您可以更改内容,然后选择 “保存并上传”。