本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 AWS Clean Rooms 机器学习
相似模型 是训练数据提供者的数据的模型,它允许种子数据提供者创建训练数据提供者数据的相似细分,该细分与其种子数据最相似。要创建可以在协作中使用的相似模型,您必须导入训练数据,创建相似模型,配置该相似模型,然后将其与一个协作相关联。
在训练数据提供者创建完机器学习模型后,种子数据提供者可以创建并导出种子细分。
使用相似模型(训练数据提供者)
导入训练数据
在创建相似模型之前,必须指定包含训练数据的 AWS Glue 表。Clean Rooms ML 不存储这些数据的副本,只存储允许其访问数据的元数据。
要在中导入训练数据 AWS Clean Rooms
-
登录 AWS Management Console 并使用您的AWS Clean Rooms 主机
打开主机 AWS 账户 (如果您尚未这样做)。 -
在左侧导航窗格中,选择机器学习建模。
-
在训练数据集选项卡上,选择创建训练数据集。
-
在创建训练数据集页面上,要了解训练数据集的详细信息,请输入名称和可选的描述。
-
通过从下拉列表中选择要配置的数据库和表来选择训练数据源。
注意
要验证是否是正确的表,请执行以下任一操作:
-
选择 “在” 中查看 AWS Glue。
-
打开查看架构以查看架构。
-
-
要了解培训详情,请从下拉列表中选择用户标识符列、项目标识符列和时间戳列。训练数据必须包含这三列。您也可以选择要在训练数据中包含的任何其他列。
“时间戳” 列中的数据必须采用 Unix 纪元时间(以秒为单位)格式。
-
(可选)如果您还有其他列要训练,请从下拉列表中选择列名称和类型。
-
在 S ervice acc ess 中,您必须指定可以访问您的数据的服务角色,如果您的数据已加密,则必须提供KMS密钥。选择创建并使用新的服务角色,Clean Rooms ML 将自动创建服务角色并添加必要的权限策略。如果您要使用特定的服务角色,请选择 “使用现有服务角色”,然后在 “服务角色名称” 字段中输入该服务角色。
如果您的数据已加密,请在AWS KMS key字段中输入您的KMS密钥,或者单击 “创建” AWS KMS key以生成新KMS密钥。
-
如果要为训练数据集启用标签,请选择添加新标签,然后输入键和值对。
-
选择创建训练数据集。
有关相应的API操作,请参见CreateTrainingDataset。
创建相似模型
在创建训练数据集后,您就可以创建相似模型了。您可以通过单个训练数据集创建很多相似模型。
您必须在中创建默认数据库, AWS Glue Data Catalog 或者在提供的角色中包含该glue:createDatabase
权限。
要在中创建外观相似的模型 AWS Clean Rooms
-
登录 AWS Management Console 并使用您的AWS Clean Rooms 主机
打开主机 AWS 账户 (如果您尚未这样做)。 -
在左侧导航窗格中,选择机器学习建模。
-
在相似模型选项卡上,选择创建相似模型。
-
在创建相似模型页面上,输入名称和可选描述,以获取相似相似模型的详细信息。
-
从下拉列表中选择要建模的训练数据集。
注意
要验证这是否是正确的训练数据集,请打开显示训练数据集详细信息以查看详细信息。
要创建新的训练数据集,请选择创建训练数据集。
-
(可选)进入培训窗口。
-
-
如果要为相似型号启用自定义加密设置,请选择 “自定义加密设置”,然后输入KMS密钥。
-
如果要为相似模型启用标签,请选择添加新标签,然后输入键和值对。
-
选择创建相似模型。
注意
模型训练可能需要几个小时到 2 天。
有关相应的API操作,请参见CreateAudienceModel。
配置相似模型
在创建相似模型后,您就可以对其进行配置以在协作中使用。您可以通过单个相似模型创建多个配置的相似模型。
要在中配置外观相似的模型 AWS Clean Rooms
-
登录 AWS Management Console 并使用您的AWS Clean Rooms 主机
打开主机 AWS 账户 (如果您尚未这样做)。 -
在左侧导航窗格中,选择机器学习建模。
-
在配置的相似模型选项卡上,选择配置相似模型。
-
在配置相似模型页面上,在配置的相似模型详细信息中,输入名称和可选的描述。
-
从下拉列表中选择您要配置的相似模型。
注意
要验证这是否是正确的相似模型,请打开显示相似模型详细信息以查看详细信息。
要创建新的相似模型,请选择创建相似模型。
-
选择您希望的最小匹配种子大小。这是种子数据提供者数据中与训练数据中的用户重叠的最小用户数。此值必须大于 0。
-
-
对于与其他成员共享的指标,选择您是否希望协作中的种子数据提供者接收模型指标,包括相关性分数。
-
对于相似细分目标位置,输入将相似细分导出到的 Amazon S3 存储桶。此存储桶必须与您的其他资源位于同一区域。
-
对于服务访问,选择将用于访问该表的现有服务角色名称。
-
对于高级素材箱大小配置,请将受众大小类型指定为绝对数字或百分比。
-
如果要为已配置的表资源启用标签,请选择添加新标签,然后输入键和值对。
-
选择 “配置相似模型”。
有关相应的API操作,请参见CreateConfiguredAudienceModel。
关联配置的相似模型
在配置相似模型后,您可以将其与一个协作相关联。
将配置的相似模型关联到 AWS Clean Rooms
-
登录 AWS Management Console 并使用您的AWS Clean Rooms 主机
打开主机 AWS 账户 (如果您尚未这样做)。 -
在左侧导航窗格中,选择协作。
-
在具有活跃成员身份选项卡上,选择一个协作。
-
在 “机器学习建模” 选项卡上的 “R eady-to-use 相似模型” 下,选择 “关联相似模型”。
-
在 Associate 配置的相似模型页面上,有关配置的相似模型关联的详细信息:
-
输入关联的配置受众模型的名称。
-
输入表的描述。
该描述有助于区分具有相似名称的其他关联的配置受众模型。
-
-
对于配置的相似模型,从下拉列表中选择一个配置的相似模型。
-
选择关联。
有关相应的API操作,请参见CreateConfiguredAudienceModelAssociation。
更新已配置的相似模型
将配置的相似模型与协作关联后,您可以对其进行更新以更改诸如名称、要共享的指标或输出 Amazon S3 位置之类的信息。
要在中更新相关配置的相似模型 AWS Clean Rooms
-
登录 AWS Management Console 并使用您的AWS Clean Rooms 主机
打开主机 AWS 账户 (如果您尚未这样做)。 -
在左侧导航窗格中,选择 ML 建模。
-
在 “配置的相似模型” 选项卡上的 “R eady-to-use 相似模型” 下,选择已配置的相似模型,然后选择 “编辑”。
-
在 “编辑” 页面上,有关配置的相似模型关联的详细信息:
-
更新名称和可选描述。
-
从下拉列表中选择要配置的相似模型。
-
选择您希望的最小匹配种子大小。这是种子数据提供者数据中与训练数据中的用户重叠的最小用户数。此值必须大于 0。
-
-
对于与其他成员共享的指标,选择您是否希望协作中的种子数据提供者接收模型指标,包括相关性分数。
-
对于相似细分目标位置,输入将相似细分导出到的 Amazon S3 存储桶。此存储桶必须与您的其他资源位于同一区域。
-
对于服务访问,选择将用于访问该表的现有服务角色名称。
-
对于高级素材箱大小配置,请选择要如何配置受众素材箱大小。
-
选择 Save changes(保存更改)。
有关相应的API操作,请参见UpdateConfiguredAudienceModel。
使用相似的区段(种子数据提供者)
创建相似细分
相似细分是与种子数据最相似的训练数据子集。
要在中创建外观相似的区段 AWS Clean Rooms
-
登录 AWS Management Console 并使用您的AWS Clean Rooms 主机
打开主机 AWS 账户 (如果您尚未这样做)。 -
在左侧导航窗格中,选择协作。
-
在具有活跃成员身份选项卡上,选择一个协作。
-
在机器学习建模选项卡上,选择创建相似细分。
-
在 “创建相似区段” 页面上,对于关联配置的相似型号,选择要用于此相似区段的关联配置相似模型。
-
要了解相似区段的详细信息,请输入名称和可选的描述。
-
对于 Seed 配置文件,请选择一个选项,然后采取推荐的操作来选择种子方法。
选项 推荐操作 亚马逊 S3 输入源 -
选择 Amazon S3 地点。
-
(可选)选择在输出中包含种子配置文件。
SQL查询 编写一个SQL查询并将其结果用作种子数据, 分析模板 从下拉列表中选择一个分析模板并使用分析模板创建的结果。 -
-
对于服务访问,选择将用于访问该表的现有服务角色名称。
-
如果要为训练数据集启用标签,请选择添加新标签,然后输入键和值对。
-
选择创建相似细分。
有关相应的API操作,请参见StartAudienceGenerationJob。
导出相似细分
在创建相似细分后,您可以将该数据导出到一个 Amazon S3 存储桶。
要在中导出相似的区段 AWS Clean Rooms
-
登录 AWS Management Console 并使用您的AWS Clean Rooms 主机
打开主机 AWS 账户 (如果您尚未这样做)。 -
在左侧导航窗格中,选择协作。
-
在具有活跃成员身份选项卡上,选择一个协作。
-
在 “机器学习建模” 选项卡的 “相似区段” 下,选择相似区段,然后选择 “导出”。
-
对于导出相似模型,为导出相似模型详细信息输入名称和可选描述。
-
对于细分大小,选择导出的细分所需的大小。
-
选择导出。
有关相应的API操作,请参见StartAudienceExportJob。
现在,您已经创建了外观相似的模型并导出了种子段,可以在 S3 中查看导出的数据了。