使用 AWS Clean Rooms 机器学习 - AWS Clean Rooms

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 AWS Clean Rooms 机器学习

相似模型 是训练数据提供者的数据的模型,它允许种子数据提供者创建训练数据提供者数据的相似细分,该细分与其种子数据最相似。要创建可以在协作中使用的相似模型,您必须导入训练数据,创建相似模型,配置该相似模型,然后将其与一个协作相关联。

在训练数据提供者创建完机器学习模型后,种子数据提供者可以创建并导出种子细分。

使用相似模型(训练数据提供者)

导入训练数据

在创建相似模型之前,必须指定包含训练数据的 AWS Glue 表。Clean Rooms ML 不存储这些数据的副本,只存储允许其访问数据的元数据。

要在中导入训练数据 AWS Clean Rooms
  1. 登录 AWS Management Console 并使用您的AWS Clean Rooms 主机打开主机 AWS 账户 (如果您尚未这样做)。

  2. 在左侧导航窗格中,选择机器学习建模

  3. 训练数据集选项卡上,选择创建训练数据集

  4. 创建训练数据集页面上,要了解训练数据集的详细信息,请输入名称和可选的描述

  5. 通过从下拉列表中选择要配置的数据库来选择训练数据源

    注意

    要验证是否是正确的表,请执行以下任一操作:

    • 选择 “在” 中查看 AWS Glue

    • 打开查看架构以查看架构。

  6. 了解培训详情,请从下拉列表中选择用户标识符列、项目标识符列和时间戳列。训练数据必须包含这三列。您也可以选择要在训练数据中包含的任何其他列。

    时间戳” 列中的数据必须采用 Unix 纪元时间(以秒为单位)格式。

  7. (可选)如果您还有其他列要训练,请从下拉列表中选择列名称类型

  8. 在 S ervice acc ess 中,您必须指定可以访问您的数据的服务角色,如果您的数据已加密,则必须提供KMS密钥。选择创建并使用新的服务角色,Clean Rooms ML 将自动创建服务角色并添加必要的权限策略。如果您要使用特定的服务角色,请选择 “使用现有服务角色”,然后在 “服务角色名称” 字段中输入该服务角色。

    如果您的数据已加密,请在AWS KMS key字段中输入您的KMS密钥,或者单击 “创建” AWS KMS key以生成新KMS密钥。

  9. 如果要为训练数据集启用标签,请选择添加新标签,然后输入对。

  10. 选择创建训练数据集

有关相应的API操作,请参见CreateTrainingDataset

创建相似模型

在创建训练数据集后,您就可以创建相似模型了。您可以通过单个训练数据集创建很多相似模型。

您必须在中创建默认数据库, AWS Glue Data Catalog 或者在提供的角色中包含该glue:createDatabase权限。

要在中创建外观相似的模型 AWS Clean Rooms
  1. 登录 AWS Management Console 并使用您的AWS Clean Rooms 主机打开主机 AWS 账户 (如果您尚未这样做)。

  2. 在左侧导航窗格中,选择机器学习建模

  3. 相似模型选项卡上,选择创建相似模型

  4. 创建相似模型页面上,输入名称和可选描述,以获取相似相似模型的详细信息

    1. 从下拉列表中选择要建模的训练数据集

      注意

      要验证这是否是正确的训练数据集,请打开显示训练数据集详细信息以查看详细信息。

      要创建新的训练数据集,请选择创建训练数据集

    2. (可选)进入培训窗口

  5. 如果要为相似型号启用自定义加密设置,请选择 “自定义加密设置”,然后输入KMS密钥。

  6. 如果要为相似模型启用标签,请选择添加新标签,然后输入对。

  7. 选择创建相似模型

    注意

    模型训练可能需要几个小时到 2 天。

有关相应的API操作,请参见CreateAudienceModel

配置相似模型

在创建相似模型后,您就可以对其进行配置以在协作中使用。您可以通过单个相似模型创建多个配置的相似模型。

要在中配置外观相似的模型 AWS Clean Rooms
  1. 登录 AWS Management Console 并使用您的AWS Clean Rooms 主机打开主机 AWS 账户 (如果您尚未这样做)。

  2. 在左侧导航窗格中,选择机器学习建模

  3. 配置的相似模型选项卡上,选择配置相似模型

  4. 配置相似模型页面上,在配置的相似模型详细信息中,输入名称和可选的描述。

    1. 从下拉列表中选择您要配置的相似模型

      注意

      要验证这是否是正确的相似模型,请打开显示相似模型详细信息以查看详细信息

      要创建新的相似模型,请选择创建相似模型。

    2. 选择您希望的最小匹配种子大小。这是种子数据提供者数据中与训练数据中的用户重叠的最小用户数。此值必须大于 0。

  5. 对于与其他成员共享的指标,选择您是否希望协作中的种子数据提供者接收模型指标,包括相关性分数。

  6. 对于相似细分目标位置,输入将相似细分导出到的 Amazon S3 存储桶。此存储桶必须与您的其他资源位于同一区域。

  7. 对于服务访问,选择将用于访问该表的现有服务角色名称

  8. 对于高级素材箱大小配置,请将受众大小类型指定为绝对数字或百分比

  9. 如果要为已配置的表资源启用标签,请选择添加新标签,然后输入对。

  10. 选择 “配置相似模型”。

有关相应的API操作,请参见CreateConfiguredAudienceModel

关联配置的相似模型

在配置相似模型后,您可以将其与一个协作相关联。

将配置的相似模型关联到 AWS Clean Rooms
  1. 登录 AWS Management Console 并使用您的AWS Clean Rooms 主机打开主机 AWS 账户 (如果您尚未这样做)。

  2. 在左侧导航窗格中,选择协作

  3. 具有活跃成员身份选项卡上,选择一个协作。

  4. 在 “机器学习建模” 选项卡上的 “R eady-to-use 相似模型” 下,选择 “关联相似模型”。

  5. 在 Associate 配置的相似模型页面上,有关配置的相似模型关联的详细信息:

    1. 输入关联的配置受众模型的名称

    2. 输入表的描述

      该描述有助于区分具有相似名称的其他关联的配置受众模型。

  6. 对于配置的相似模型,从下拉列表中选择一个配置的相似模型。

  7. 选择关联

有关相应的API操作,请参见CreateConfiguredAudienceModelAssociation

更新已配置的相似模型

将配置的相似模型与协作关联后,您可以对其进行更新以更改诸如名称、要共享的指标或输出 Amazon S3 位置之类的信息。

要在中更新相关配置的相似模型 AWS Clean Rooms
  1. 登录 AWS Management Console 并使用您的AWS Clean Rooms 主机打开主机 AWS 账户 (如果您尚未这样做)。

  2. 在左侧导航窗格中,选择 ML 建模

  3. 在 “配置的相似模型” 选项卡上的 “R eady-to-use 相似模型” 下,选择已配置的相似模型,然后选择 “编辑”。

  4. “编辑” 页面上,有关配置的相似模型关联的详细信息

    1. 更新名称和可选描述

    2. 从下拉列表中选择要配置的相似模型

    3. 选择您希望的最小匹配种子大小。这是种子数据提供者数据中与训练数据中的用户重叠的最小用户数。此值必须大于 0。

  5. 对于与其他成员共享的指标,选择您是否希望协作中的种子数据提供者接收模型指标,包括相关性分数。

  6. 对于相似细分目标位置,输入将相似细分导出到的 Amazon S3 存储桶。此存储桶必须与您的其他资源位于同一区域。

  7. 对于服务访问,选择将用于访问该表的现有服务角色名称

  8. 对于高级素材箱大小配置,请选择要如何配置受众素材箱大小。

  9. 选择 Save changes(保存更改)

有关相应的API操作,请参见UpdateConfiguredAudienceModel

使用相似的区段(种子数据提供者)

创建相似细分

相似细分是与种子数据最相似的训练数据子集。

要在中创建外观相似的区段 AWS Clean Rooms
  1. 登录 AWS Management Console 并使用您的AWS Clean Rooms 主机打开主机 AWS 账户 (如果您尚未这样做)。

  2. 在左侧导航窗格中,选择协作

  3. 具有活跃成员身份选项卡上,选择一个协作。

  4. 机器学习建模选项卡上,选择创建相似细分

  5. 在 “创建相似区段” 页面上,对于关联配置的相似型号,选择要用于此相似区段的关联配置相似模型。

  6. 要了解相似区段的详细信息,请输入名称和可选的描述

  7. 对于 Seed 配置文件,请选择一个选项,然后采取推荐的操作来选择种子方法

    选项 推荐操作
    亚马逊 S3 输入源
    1. 选择 Amazon S3 地点。

    2. (可选)选择在输出中包含种子配置文件

    SQL查询 编写一个SQL查询并将其结果用作种子数据,
    分析模板 从下拉列表中选择一个分析模板并使用分析模板创建的结果。
  8. 对于服务访问,选择将用于访问该表的现有服务角色名称

  9. 如果要为训练数据集启用标签,请选择添加新标签,然后输入对。

  10. 选择创建相似细分

有关相应的API操作,请参见StartAudienceGenerationJob

导出相似细分

在创建相似细分后,您可以将该数据导出到一个 Amazon S3 存储桶。

要在中导出相似的区段 AWS Clean Rooms
  1. 登录 AWS Management Console 并使用您的AWS Clean Rooms 主机打开主机 AWS 账户 (如果您尚未这样做)。

  2. 在左侧导航窗格中,选择协作

  3. 具有活跃成员身份选项卡上,选择一个协作。

  4. 在 “机器学习建模” 选项卡的 “相似区段” 下,选择相似区段,然后选择 “导出”。

  5. 对于导出相似模型,为导出相似模型详细信息输入名称和可选描述

  6. 对于细分大小,选择导出的细分所需的大小。

  7. 选择导出

有关相应的API操作,请参见StartAudienceExportJob

现在,您已经创建了外观相似的模型并导出了种子段,可以在 S3 中查看导出的数据了。