操作交互数据集架构要求(自定义) - Amazon Personalize

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

操作交互数据集架构要求(自定义)

操作交互数据集存储来自用户与操作数据集中的操作之间交互的历史数据和实时数据。有关 Amazon Personalize 可以使用的数据类型的信息,请参阅操作交互数据集

您为每次交互提供的数据必须与您的架构相匹配。根据您的架构,交互元数据可能包含空值。您的架构必须至少包含以下内容:

  • USER_ID

  • ACTION_ID

  • TIMESTAMP

  • EVENT_TYPE

您可以根据您的使用案例和数据添加其它字段。您可以选择字段名称和数据类型,除非字段列出为必需或保留,并且数据类型在架构数据类型中列出。

有关操作交互数据集的最低要求和最大数据限制的更多信息,请参阅服务限额

操作交互数据集架构示例(自定义)

以下示例显示了只包含必需字段的操作交互数据集的架构。有关一般架构格式要求的信息,请参阅架构格式设置要求

{ "type": "record", "name": "ActionInteractions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ACTION_ID", "type": "string" }, { "name": "EVENT_TYPE", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }

对于此架构,CSV 文件中的前几行历史数据可能如下所示。请注意,IMPRESSION 的某些值为 null。

USER_ID,ACTION_ID,EVENT_TYPE,TIMESTAMP 35,73,Viewed,1586731606 54,35,Not taken,1586731609 9,33,Viewed,1586735158 23,10,Taken,1586735697 27,11,Taken,1586735763 ... ...