調整搜尋相關性 - Amazon Kendra

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

調整搜尋相關性

Amazon Kendra 查詢會產生依其相關性排名的搜尋結果。索引中的可搜索字段或屬性都有助於此排名。

您可以透過相關性調整來修改欄位或屬性對搜尋相關性的影響。您可以在索引層級手動調整搜尋相關性,也可以在索引層級設定調整組態,或者在查詢層級透過覆寫在索引層級設定的組態來完成。

當您使用相關性調整時,當查詢包含符合欄位或屬性的字詞時,系統會提升回應結果。您也可以指定當有相符項目時,文件會收到多少提升。相關性調整不會導 Amazon Kendra 致在查詢響應中包含文檔,它只是 Amazon Kendra 用於確定文檔相關性的因素之一。

您可以提升索引中的特定欄位或屬性,為特定回應指派更多重要性。例如,當有人搜索「什麼時候是 re:發明?」 您可以提高該領域文檔新鮮度的相關_last_update_at性。或者,在研究報告的索引中,您可以在「源」字段中提升特定數據源。

您還可以根據論壇和其他支持知識庫中常見的投票或查看次數來提高文檔。您可以結合增強功能,例如增強檢視更多、更新的文件。

您可以使用Importance參數來設定文件接收的提升量。越高Importance,欄位或屬性越多,就會提高文件的相關性。當您在查詢層級調整索引或 tune 時,請以較小的遞增方式增加Importance參數的值,直到您得到想要的效果為止。若要判斷是否要改善搜尋結果,請執行搜尋並將結果與先前的查詢進行比較。

您可以指定日期、數字或字串屬性,以便在查詢層級調整索引或調整。您StringList只能在索引層級調整類型的欄位或屬性。每個欄位或屬性都有特定條件,以便在提升結果時使用。

  • 日期欄位或屬性 — 日期欄位、DurationFreshnessRankOrder有三個特定條件。

    • Duration設定提升套用至的時間週期。例如,如果您將時間範圍設定為 86400 秒 (即一天),則增幅會在一天後開始減少。重要性越高,增強效果就越快就會減少。

    • Freshness決定將文件套用至欄位或屬性時的最近程度。如果您套用Freshness至建立日期或上次更新日期的欄位,則會將最近建立或最後更新的文件視為比較舊的文件「更新」。例如,如果文件 1 是在 11 月 14 日建立的,而文件 2 是在 11 月 5 日建立的,則文件 1 會比文件 2「新鮮」。而且,如果文件 1 上次在 11 月 14 日更新,文件 2 最後更新於 11 月 20 日,則文件 2 比文件 1「更新」。文檔越新鮮,應用的這種提升就越多。您的索引中只能有一個Freshness欄位。

    • RankOrder以遞增或遞減順序套用提升。如果您指定ASCENDING,則較晚的日期具有優先順序。如果您指定DESCENDING,較早的日期具有優先順序。

  • 數字欄位或屬性 — 對於數字欄位或屬性,您可以指定決定欄位或屬性相關性時 Amazon Kendra 應使用的排名順序。如果您指定ASCENDING,則會優先考慮較高的數字。如果您指定DESCENDING,則較低的數字具有優先順序。

  • 字串欄位或屬性 — 對於字串欄位或屬性,您可以建立欄位的類別,讓每個類別都有不同的提升。例如,如果您提升名為「部門」的欄位或屬性,您可以對「HR」的文件提供不同的提升,而不是「法律」中的文件。您可以提高類型的字段或屬性String。您只能在索引層級提升StringList欄位。

在索引層級進行相關性調整

您可以使用主控台在索引詳細資料或 UpdateIndexAPI 中設定調整,來調整索引層級的欄位或屬性的相關性。

下列範例會將_last_updated_at欄位設定為文件的Freshness欄位。

"DocumentMetadataConfigurationUpdates" : [ { "Name": "_last_updated_at", "Type": "DATE_VALUE", "Relevance": { "Freshness": TRUE, "Importance": 2 } } ]

下列範例會將不同的重要性套用至「部門」欄位中的不同類別。

"DocumentMetadataConfigurationUpdates" : [ { "Name": "department", "Type": "STRING_VALUE", "Relevance": { "Importance": 2, "ValueImportanceMap": { "HR": 3, "Legal": 1 } } } ]

在查詢層級進行相關性調整

您可以使用查詢 API 在查詢層級調整欄位或屬性的相關性。

主控台不支援在查詢層級進行相關性調整。

在查詢層級進行調整可以加快測試相關性調整的過程,因為您不需要為每個測試手動更新索引中的調整配置。您可以通過在查詢中傳遞調整配置來調整文檔的相關性。然後,您可以看到從不同配置獲得的不同結果。在查詢中傳遞的組態會覆寫在索引層級設定的組態。

下列範例會覆寫套用至「部門」欄位的重要性,以及在索引層級設定的每個部門類別,如上述範例所示。當用戶輸入搜索查詢時,「部門」字段具有公平的重要性,而法律部門比人力資源部門更重要。

"DocumentRelevanceOverrideConfigurations" : [ { "Name": "department", "Type": "STRING_VALUE", "Relevance": { "Importance": 2, "ValueImportanceMap": { "HR": 2, "Legal": 8 } } } ]