查詢拼字檢查 - Amazon Kendra

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

查詢拼字檢查

Amazon Kendra 拼字檢查程式會建議查詢的拼字校正。這可以幫助您將搜索結果的出現次數降至最低,並返回相關結果。您的使用者可能會從拼字錯誤的查詢中收到零搜尋結果,但沒有相符的結果或沒有傳回的文件。或者,您的使用者可能會從拼字錯誤的查詢收到不相關的搜尋結果

拼字檢查程式旨在根據索引文件中出現的單字,以及更正的單字與拼錯的單字相符程度,建議更正錯誤的單字。例如,如果編製索引的文件中出現「陳述式」一詞,則這可能會與查詢「年終財務統計」中拼錯的「statments」字詞非常相符。

拼字檢查程式會傳回用來取代原始查詢文字中拼錯字詞的預期或更正文字。例如,「去除 kendre 搜尋」可能會傳回「部署 Kendra 搜尋」。您也可以使用 API 中提供的偏移位置,在前端應用程式中的查詢中反白顯示或斜體顯示傳回的更正字詞。在控制台中,默認情況下突出顯示或斜體更正的單詞。例如,「部署 Kendra 搜索」。

對於出現在索引文件中的企業特定或特殊字詞,拼字檢查程式不會將這些字詞誤解為查詢中的拼字錯誤。例如,「亞馬遜獼猴」未更正為「亞馬遜獼猴」。

對於以連字符連接的單字 (例如「年終」),拼字檢查程式會將這些字詞視為個別單字來建議更正這些字詞。例如,「yaer-end」的建議修正可能是「年底」。

對於DOCUMENTQUESTION_ANSWER查詢回應類型,拼字檢查程式會根據文件內文中的單字,建議對拼錯的單字進行更正。文件內文比標題更可靠,用於建議與拼錯字密切相符的更正。對於ANSWER查詢回應類型,拼字檢查程式會根據索引中預設問題和答案文件中的文字建議更正。

您可以使用SpellCorrectionConfiguration物件啟動拼字檢查程式。您設定IncludeQuerySpellCheckSuggestionsTRUE。默認情況下,控制台中的拼寫檢查器是激活的。默認情況下,它內置在控制台中。

拼字檢查器也可以針對多種語言的查詢建議拼字校正,而不僅僅是英文。如需拼字檢查程式支援的語言清單,請參閱Amazon Kendra 支援的語言

使用具有預設限制的查詢拼字檢查程式

拼字檢查器設計有特定的預設值或限制。以下是當您啟動拼字校正建議時所套用的目前限制清單。

  • 對於長度少於三個字元或超過 30 個字元的單字,則無法傳回建議的拼字更正。若要允許超過 30 個字元或少於三個字元,請聯絡 Sup port 部門。

  • 建議的拼字更正無法根據使用者存取控制或您的使用者內容篩選存取控制清單來限制建議。拼字校正是以索引文件中的所有字詞為基礎,無論文字是否限於特定使用者。如果您想避免某些單詞出現在建議的查詢拼寫更正中,請不要激活SpellCorrectionConfiguration

  • 對於包含數字的單字,則無法傳回建議的拼字校正。例如,「如何 2 不是 br8k ubun2」。

  • 建議的拼字校正無法使用未出現在索引文件中的單字。

  • 建議的拼字校正無法使用經常在編製索引文件中經常使用低於 0.01% 的單字。若要變更 0.01% 閾值,請聯絡 Sup port 部門。