項目互動資料集結構描述需求 (自訂) - Amazon Personalize

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

項目互動資料集結構描述需求 (自訂)

I tem 互動資料集會儲存使用者與目錄中項目之間互動的歷史和即時資料。如需 Amazon Personalize 可以使用的互動資料類型的相關資訊,請參閱項目互動資料集

您為每次互動提供的資料必須符合您的結構描述。根據您的結構描述,互動中繼資料可以包含空值/空值。您至少必須為每次互動提供下列資訊:

  • 使用者 ID

  • 項目識別碼

  • 時間戳記 (採用 Unix 紀元時間格式)

您可以根據使用案例和資料自由新增其他欄位。只要欄位未列為必填或保留,且中列出了資料類型架構資料類型,欄位名稱和資料類型就由您決定。

您可以新增至項目互動資料集的選擇性中繼資料欄位總數上限,以及項目互動資料中不同事件類型的總數為 10。此計數中包含的中繼資料欄位為 EVENT_TYPE、EVENT_VALUE 欄位,以及您新增至結構描述的任何自訂中繼資料欄位。中繼資料欄位 (不包括保留欄位 (例如 INIMATE) 數目上限為 5。分類值最多可包含 1000 個字元。如果您與超過 1000 的分類值互動,資料集匯入工作將會失敗。

如需項目互動資料集的最低需求和最大資料限制的詳細資訊,請參閱Service Quotas

互動結構描述示例(自定義)

下列範例顯示 Item 互動資料集的結構描述。USER_IDITEM_IDTIMESTAMP 欄位是必要的。EVENT_TYPEEVENT_VALUE、和IMPRESSION欄位是選擇性的保留關鍵字,可由 Amazon Personalize 識別。EVENT_TYPE 必須是字串類型,而且不能是分類的。 LOCATIONDEVICE是可選的上下文元數據字段。如需架構需求的資訊,請參閱自訂資料集和結構描述需

{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "EVENT_TYPE", "type": "string" }, { "name": "EVENT_VALUE", "type": [ "float", "null" ] }, { "name": "LOCATION", "type": "string", "categorical": true }, { "name": "DEVICE", "type": [ "string", "null" ], "categorical": true }, { "name": "TIMESTAMP", "type": "long" }, { "name": "IMPRESSION", "type": "string" } ], "version": "1.0" }

對於此結構描述,CSV 檔案中的前幾行歷史資料可能如下所示。請注意,事件值的某些值為空。

USER_ID,ITEM_ID,EVENT_TYPE,EVENT_VALUE,LOCATION,DEVICE,TIMESTAMP,IMPRESSION 35,73,click,,Ohio,Tablet,1586731606,73|70|17|95|96|92|55|45|16|97|56|54|33|94|36|10|5|43|19|13|51|90|65|59|38 54,35,watch,0.75,Indiana,Cellphone,1586735164,35|82|78|57|20|63|1|90|76|75|49|71|26|24|25|6|37|85|40|98|32|13|11|54|48 9,33,click,,Oregon,Cellphone,1586735158,68|33|62|6|15|57|45|24|78|89|90|40|26|91|66|31|47|17|99|29|27|41|77|75|14 23,10,watch,0.25,California,Tablet,1586735697,92|89|36|10|39|77|4|27|79|18|83|16|28|68|78|40|50|3|99|7|87|49|12|57|53 27,11,watch,0.55,Indiana,Tablet,1586735763,11|7|39|95|71|1|6|40|41|28|99|53|68|76|0|65|69|36|22|42|34|67|24|20|66 ... ...