建立自訂文件欄位 - Amazon Kendra

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立自訂文件欄位

注意

功能支援會因索引類型和API使用的搜尋而有所不同。若要查看API您所使用的索引類型和搜尋是否支援此功能,請參閱搜尋索引

您可以在 Amazon Kendra 索引中為您的文件建立自訂屬性或欄位。例如,您可以建立名為 "Department" 的自訂欄位或屬性,其值為 "HR"、"Sales" 和 "Manufacturing"。如果您將這些自訂欄位或屬性映射到您的 Amazon Kendra 索引,則可以使用它們來篩選搜尋結果,以依 "HR" 部門屬性包含文件。

您必須先在索引中建立 欄位,才能使用自訂欄位或屬性。使用 主控台編輯資料來源欄位映射以新增自訂欄位,或使用 UpdateIndexAPI建立索引欄位。建立欄位後,就無法變更欄位資料類型。

對於大多數資料來源,您可以將外部資料來源中的欄位映射到 中的對應欄位 Amazon Kendra。如需詳細資訊,請參閱映射資料來源欄位。對於 S3 資料來源,您可以使用JSON中繼資料檔案建立自訂欄位或屬性。

您最多可以建立 500 個自訂欄位或屬性。

您也可以使用 Amazon Kendra 預留或常用欄位。如需詳細資訊,請參閱文件屬性或欄位

更新自訂文件欄位

使用 UpdateIndex API,您可以使用 DocumentMetadataConfigurationUpdates 參數新增自訂欄位或屬性。

下列JSON範例使用 DocumentMetadataConfigurationUpdates將名為「部門」的欄位新增至索引。

"DocumentmetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE" } ]

下列各節包含使用 BatchPutDocument和 為 Amazon S3 資料來源新增自訂屬性或欄位的範例。

使用 新增自訂屬性或欄位 BatchPutDocument API

當您使用 BatchPutDocumentAPI將文件新增至索引時,您會指定自訂欄位或屬性做為 的一部分Attributes。您可以在呼叫 時新增多個欄位或屬性API。您最多可以建立 500 個自訂欄位或屬性。下列範例是將「部門」新增至文件的自訂欄位或屬性。

"Attributes": { "Department": "HR", "_category": "Vacation policy" }

將自訂屬性或欄位新增至 Amazon S3 資料來源

當您使用 S3 儲存貯體做為索引的資料來源時,您會將中繼資料新增至具有配套中繼資料檔案的文件。您可以將中繼資料JSON檔案放在與文件平行的目錄結構中。如需詳細資訊,請參閱 S3 文件中繼資料

您可以在 Attributes JSON 結構中指定自訂欄位或屬性。您最多可以建立 500 個自訂欄位或屬性。例如,下列範例使用 Attributes 來定義三個自訂欄位或屬性,以及一個預留欄位。

"Attributes": { "brand": "Amazon Basics", "price": 1595, "_category": "sports", "subcategories": ["outdoors", "electronics"] }

下列步驟將逐步引導您將自訂屬性新增至 Amazon S3 資料來源。

步驟 1:建立 Amazon Kendra 索引

請依照 中的步驟建立索引來建立 Amazon Kendra 索引。

步驟 2:更新索引以新增自訂文件欄位

建立索引之後,您會將欄位新增至索引。下列程序說明如何使用 主控台和 將欄位新增至索引CLI。

Console
建立索引欄位
  1. 請確定您已建立索引

  2. 然後,從左側導覽選單中,從資料管理中選擇面向定義

  3. 索引欄位設定指南索引欄位中,選擇新增欄位以新增自訂欄位。

  4. 新增索引欄位對話方塊中,執行下列動作:

    • 欄位名稱 – 新增欄位名稱。

    • 資料類型 – 選取資料類型,無論是字串字串清單日期

    • 用量類型 – 選取用量類型,無論是人臉資料表可搜尋可顯示可排序

      然後,選取新增

    針對您要映射的任何其他欄位,重複最後一個步驟。

CLI
aws kendra update-index \ --region $region \ --endpoint-url $endpoint \ --application-id $applicationId \ --index-id $indexId \ --document-metadata-configuration-updates \ "[ { "Name": "string", "Type": "STRING_VALUE"|"STRING_LIST_VALUE"|"LONG_VALUE"|"DATE_VALUE", "Relevance": { "Freshness": true|false, "Importance": integer, "Duration": "string", "RankOrder": "ASCENDING"|"DESCENDING", "ValueImportanceMap": {"string": integer ...} }, "Search": { "Facetable": true|false, "Searchable": true|false, "Displayable": true|false, "Sortable": true|false } } ... ]"

步驟 3:建立 Amazon S3 資料來源,並將資料來源欄位映射至自訂屬性

若要建立 Amazon S3 資料來源並將欄位映射到其中,請遵循 中的指示Amazon S3

如果您使用的是 API,請在使用 CreateDataSource configuration時使用 下的 fieldMappings 屬性API。

如需資料來源欄位映射方式的概觀,請參閱 映射資料來源欄位