項目資料集結構描述需求 (自訂) - Amazon Personalize

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

項目資料集結構描述需求 (自訂)

項目」資料集會儲存目錄中項目的相關中繼資料。這可能包括每個項目的價格,類型和可用性等信息。如需可匯入到 Amazon Personalize 項目資料類型的相關資訊,請參閱項目資料集

您為每個項目提供的資料必須符合 Items 資料集結構描述。您至少必須為每個項目提供「項目 ID」(長度上限為 256 個字元)。根據您的結構描述,項目中繼資料可以包含空值/空值。您的結構描述必須至少有一個中繼資料欄位,但是如果您新增null類型,則該項目的此值可能為 null。您可以根據使用案例和資料自由新增其他欄位。只要欄位未列為必填或保留,且中列出了資料類型架構資料類型,欄位名稱和資料類型就由您決定。

若要使用分類資料,請新增類型欄位,stringtrue在結構描述中將欄位的分類屬性設定為。然後在大量 CSV 檔案中包含分類資料,並匯入個別項目。分類值最多可包含 1000 個字元。如果您的項目分類值超過 1000 個字元,則資料集匯入工作將會失敗。

對於具有多個類別的項目,請使用垂直列「|」分隔每個值。舉例來說,對於「類型」欄位,您的項目資料可能是Action|Crime|Biopic。如果您有多層級的分類資料,而某些項目在階層中的每個層級都有多個類別,請為每個層級新增欄位,並在每個欄位名稱之後附加一個層級指示器:「類型」、「GENRE_L2」、「GENRE_L3」。這可讓您根據子類別篩選建議,即使某個項目屬於多個多層級類別 (有關建立和使用篩選器的資訊,請參閱篩選建議和使用者區段)。例如,每個類別層級的影片可能包含下列資料:

  • 類型:動作 | 冒險

  • 類型 _L2:犯罪 | 西方

  • 類型 _L3: 傳記

在這個例子中,視頻是在動作 > 犯罪 > 傳記片層次結構冒險 > 西方 > 傳記片層次結構。我們建議僅使用最多 L3,但如有必要,您可以使用更多級別。

在模型培訓期間,Amazon Personalize 化考慮最多 75 萬個項目。如果您匯入超過 750,000 個項目,Amazon Personalize 會決定要包含在訓練中的項目,並著重於包括新項目 (您最近新增但沒有互動的項目) 以及包含最近互動資料的現有項目。

如需 Items 資料集的最低需求和最大資料限制的詳細資訊,請參閱Service Quotas

項目資料集結構描述範例 (自訂)

下列範例顯示如何建構項目結構描述。ITEM_ID 欄位是必要的。此GENRE欄位是分類中繼資料,而且DESCRIPTION欄位是文字中繼資料。至少需要一個中繼資料欄位。您最多可以新增 100 個中繼資料欄位。CREATION_TIMESTAMP欄位是保留的關鍵字。如需結構描述需求的資訊,請參閱自訂資料集和結構描述需

{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" }, { "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true } ], "version": "1.0" }

對於此結構描述,CSV 檔案中的前幾行歷史資料可能如下所示。

ITEM_ID,GENRES,CREATION_TIMESTAMP,DESCRIPTION 1,Adventure|Animation|Children|Comedy|Fantasy,1570003267,"This is an animated movie that features action, comedy, and fantasy. Audience is children. This movie was released in 2004." 2,Adventure|Children|Fantasy,1571730101,"This is an adventure movie with elements of fantasy. Audience is children. This movie was release in 2010." 3,Comedy|Romance,1560515629,"This is a romantic comedy. The movie was released in 1999. Audience is young women." 4,Comedy|Drama|Romance,1581670067,"This movie includes elements of both comedy and drama as well as romance. This movie was released in 2020." ... ...