建立自訂文件欄位 - Amazon Kendra

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立自訂文件欄位

您可以在 Amazon Kendra 索引中為文件建立自訂屬性或欄位。例如,您可以建立名為「部門」的自訂欄位或屬性,其值為「HR」、「業務」和「製造」。例如,如果將這些自訂欄位或屬性對應至 Amazon Kendra 索引,您可以使用這些欄位來篩選搜尋結果,以便依「HR」部門屬性包含文件。

您必須先在索引中建立欄位,才能使用自訂欄位或屬性。使用主控台編輯資料來源欄位對應,以新增自訂欄位,或使用 UpdateIndexAPI 建立索引欄位。建立欄位後,就無法變更欄位資料類型。

對於大多數資料來源,您可以將外部資料來源中的欄位對映至中的對應欄位 Amazon Kendra。如需詳細資訊,請參閱映射資料來源欄位。對於 S3 資料來源,您可以使用 JSON 中繼資料檔案建立自訂欄位或屬性。

您最多可以建立 500 個自訂欄位或屬性。

您也可以使用 Amazon Kendra 保留欄位或公用欄位。如需詳細資訊,請參閱文件屬性或欄位

更新自訂文件欄位

透過 UpdateIndex API,您可以使用DocumentMetadataConfigurationUpdates參數新增自訂欄位或屬性。

下面的 JSON 示例使DocumentMetadataConfigurationUpdates用一個名為「部門」的字段添加到索引。

"DocumentmetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE" } ]

以下各節包括使用BatchPutDocument和為 Amazon S3 資料來源新增自訂屬性或欄位的範例。

使用 BatchPutDocument API 新增自訂屬性或欄位

當您使用 BatchPutDocumentAPI 將文件新增至索引時,您可以指定自訂欄位或屬性做為的一部分Attributes。您可以在呼叫 API 時新增多個欄位或屬性。您最多可以建立 500 個自訂欄位或屬性。下列範例是將「部門」新增至文件的自訂欄位或屬性。

"Attributes": { "Department": "HR", "_category": "Vacation policy" }

將自訂屬性或欄位新增至資 Amazon S3 料來源

當您使用 S3 儲存貯體做為索引的資料來源時,您可以使用隨附的中繼資料檔案將中繼資料新增至文件。您可以將中繼資料 JSON 檔案放置在與文件 parallel 的目錄結構中。如需詳細資訊,請參閱 S3 文件中繼資料

您可以在 Attributes JSON 結構中指定自訂欄位或屬性。您最多可以建立 500 個自訂欄位或屬性。例如,下列範例使用Attributes定義三個自訂欄位或屬性以及一個保留欄位。

"Attributes": { "brand": "Amazon Basics", "price": 1595, "_category": "sports", "subcategories": ["outdoors", "electronics"] }

以下步驟將引導您完成將自訂屬性新增至 Amazon S3 資料來源的步驟。

步驟 1:建立 Amazon Kendra 索引

請依照中的步驟建立索引建立您的 Amazon Kendra 索引。

第 2 步:更新索引以添加自定義文檔字段

建立索引之後,您可以將欄位新增至索引。下列程序顯示如何使用主控台和 CLI 將欄位新增至索引。

Console
若要建立索引欄位
  1. 請確定您已建立索引

  2. 然後,從左側導覽功能表中,從資料管理中選擇 Facet 定義

  3. 在 [索引欄位設定指南] 的 [索引欄位] 中,選擇 [新增欄位] 以新增自訂欄位。

  4. 在 [新增索引欄位] 對話方塊中,執行下列動作:

    • 欄位名稱 — 新增欄位名稱。

    • 資料類型 — 選取資料類型,無論是「字串」、「字串清單」還是「日期」。

    • 使用類型 — 選取使用類型,是否可分解、可搜尋可顯示及可排序。

      然後,選取 [新增]。

    對您要對映的任何其他欄位重複最後一個步驟。

CLI
aws kendra update-index \ --region $region \ --endpoint-url $endpoint \ --application-id $applicationId \ --index-id $indexId \ --document-metadata-configuration-updates \ "[ { "Name": "string", "Type": "STRING_VALUE"|"STRING_LIST_VALUE"|"LONG_VALUE"|"DATE_VALUE", "Relevance": { "Freshness": true|false, "Importance": integer, "Duration": "string", "RankOrder": "ASCENDING"|"DESCENDING", "ValueImportanceMap": {"string": integer ...} }, "Search": { "Facetable": true|false, "Searchable": true|false, "Displayable": true|false, "Sortable": true|false } } ... ]"

步驟 3:建立 Amazon S3 資料來源,並將資料來源欄位對應至自訂屬性

若要建立 Amazon S3 資料來源並將欄位對應至該資料來源,請遵循中的指示Amazon S3

如果您使用的是 API,請在使用 CreateDataSourceAPI configuration 時使用下方的fieldMappings屬性。

有關如何對應資料來源欄位的概觀,請參閱對映資料來源欄位