查询拼写检查程序 - Amazon Kendra

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

查询拼写检查程序

Amazon Kendra 拼写检查工具会建议对查询进行拼写更正。这可以帮助您将出现零搜索结果的次数降至最低,并返回相关结果。对于拼写错误的查询,您的用户可能会收到零搜索结果为,即没有匹配结果或未返回文档。或者,您的用户可能会从拼写错误的查询中收到不相关的搜索结果

拼写检查器旨在根据索引文档中出现的单词以及更正后的单词与拼写错误的单词的匹配程度,对拼写错误的单词提出更正建议。例如,如果您的索引文档中出现“statements”一词,则这可能与查询“年终财务报表”中拼写错误的“statments”一词非常匹配。

拼写检查器返回替换原始查询文本中拼写错误的单词的预期或更正的单词。例如,“depoying kendre search”可能返回“deploying Kendra search”。您还可以使用 API 中提供的偏移位置在前端应用程序的查询中突出显示或斜体显示返回的更正单词。在控制台中,默认情况下,更正后的单词会突出显示或斜体显示。例如,“deploying Kendra search”。

对于索引文档中出现的业务特定术语或专业术语,拼写检查工具不会将这些术语误解为查询中的拼写错误。例如,“amazon macie”不会更正为“amazon mace”。

对于带连字符的单词,例如“year-end”,拼写检查器会将其视为单个单词,以建议对这些单词进行更正。例如,“yaer-end”的建议更正可能是“year-end”。

对于 DOCUMENTQUESTION_ANSWER 查询响应类型,拼写检查器会根据文档正文中的单词建议更正拼写错误的单词。在建议与拼写错误的单词非常匹配的更正时,文档正文比标题更可靠。对于 ANSWER 查询响应类型,拼写检查器会根据索引中默认问答文档中的单词建议更正。

你可以使用该SpellCorrectionConfiguration物体激活拼写检查器。将 IncludeQuerySpellCheckSuggestions 设置为 TRUE。默认情况下,控制台中的拼写检查器处于激活状态。默认情况下,它内置在控制台中。

拼写检查器还可以为多种语言的查询提供拼写更正建议,而不仅仅是英语。有关拼写检查器支持的语言列表,请参阅 Amazon Kendra 支持的语言

使用带有默认限制的查询拼写检查器

拼写检查器设计有特定的默认值或限制。以下是激活拼写校正建议时适用的当前限制列表。

  • 对于长度少于三个字符或大于 30 个字符的单词,不能返回建议的拼写更正。要允许超过 30 个字符或少于三个字符,请联系支持部门

  • 建议的拼写更正不能根据用户访问控制或用户上下文筛选的访问控制列表来限制建议。拼写校正基于已编入索引的文档中的所有单词,无论这些单词是否仅限于某些用户。如果您想避免某些单词出现在建议的查询拼写更正中,请不要激活 SpellCorrectionConfiguration

  • 对于包含数字的单词,无法返回建议的拼写更正。例如,“how 2 not br8k ubun2”。

  • 建议的拼写更正不能使用未出现在已编入索引的文档中的单词。

  • 建议的拼写更正不能使用索引文档中出现频率低于 0.01% 的单词。要更改 0.01% 的阈值,请联系支持部门