在 AWS Clean Rooms ML 中关联配置的模型算法 - AWS Clean Rooms

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 AWS Clean Rooms ML 中关联配置的模型算法

配置模型算法后,就可以将模型算法与协作关联了。关联模型算法后,该模型算法可供协作的所有成员使用。

下图显示了在创建容器训练镜像并配置模型算法之后,将配置的模型算法关联为最后一步。

概述如何贡献自定义 ML 模型。
Console
注意

关联模型算法后,无法对其进行编辑。要进行更改,可以删除关联的模型算法并关联新的算法。

关联自定义 ML 模型算法(控制台)
  1. 登录 AWS Management Console 并在 https://console.aws.amazon.com/clean room AWS Clean Rooms s 上打开控制台。

  2. 在左侧导航窗格中,选择自定义 ML 模型

  3. 自定义机器学习模型页面上,选择要与协作关联的已配置模型算法,然后选择关联到协作

  4. 在 “关联已配置的模型算法” 窗口中,选择要关联的协

  5. 选择选择协作

  6. 在 “关联模型算法” 页面上,输入模型算法关联的详细信息,输入名称和可选的描述

  7. 对于模型算法,选择已配置的模型算法

  8. 对于经过训练的模型导出隐私配置

    1. 要导出模型文件,请选中模型文件复选框。

    2. 要导出输出文件,请选中 “输出文件” 复选框。

    3. 输入导出数据的最大大小值。该值必须介于 0.01 和 10 之间。

  9. (可选)如果您想向成员发送完整的错误日志或更短的错误摘要,请在训练有素的模型推理作业隐私配置下,

    1. 在 “完整日志” 下, IDs从下拉列表中选择一个或多个帐户

    2. (可选)如果要发送与筛选模式匹配的日志,请输入筛选模式

    3. (可选)如果要添加其他帐户和可选的过滤器模式,请选择添加日志策略

    4. 在 “错误摘要” 下, IDs从下拉列表中选择一个或多个账户

    5. (可选)选择一个或多个要密文的实体,以指定将从错误日志或错误摘要中删除哪些实体。

      • PII — 编辑个人身份信息

      • 数字 — 编辑数字

      • 自定义 — 根据自定义密文模式进行密文

      1. 如果您在上一步中选择了自定义,请输入自定义密文模式。这将记录与此模式匹配的信息。

      2. (可选)如果要添加其他自定义密文图案,请选择添加其他自定义图案

  10. (可选)如果要配置经过训练的模型指标,请在 “训练模型指标配置” 下,从下拉列表中选择噪音水平

    您可以选择 “”、“”、“” 和 “”。

  11. (可选)如果要设置最大构件大小,请在构件配置下输入最大工件大小值。该值必须介于 0.01 和 10 之间。

  12. (可选)如果要启用标签,请选择添加新标签,然后输入密钥对。

  13. 选择关联

API

关联自定义 ML 模型算法 (API)

使用您的特定参数运行以下代码。

您还提供了一份隐私政策,该政策定义了谁有权访问不同的日志,允许客户定义正则表达式,以及可以从训练模型输出或推理结果中导出多少数据。

注意

配置的模型算法关联是不可变的。

import boto3 acr_ml_client= boto3.client('cleanroomsml') acr_ml_client.create_configured_model_algorithm_association( name='configured_model_algorithm_association_name', description='purpose of the association', configuredModelAlgorithmArn='arn:aws:cleanrooms-ml:region:account:membership/membershipIdentifier/configured-model-algorithm/identifier', privacyConfiguration={ "policies": { "trainedModelExports": { "filesToExport": ['files to export'], "containerLogs": [ { "allowedAccountIds": ['member_account_id'], "filterPattern": ['filter pattern'], "logRedactionConfiguration": { "entitiesToRedact": [ 'ALL_PERSONALLY_IDENTIFIABLE_INFORMATION', 'NUMBERS', 'CUSTOM' ], "customEntityConfig": { "customDataIdentifiers": [ 'custom_regex_1', 'custom_regex_2' ] } } } ], "containerMetrics": { "noiseLevel": 'noise value' }, "maxArtifactSize": { "unit": 'unit', "value": 'number' } }, "trainedModelInferenceJobs": { "containerLogs": [ { "allowedAccountIds": ['member_account_id'], "filterPattern": ['filter pattern'], "logRedactionConfiguration": { "entitiesToRedact": [ 'ALL_PERSONALLY_IDENTIFIABLE_INFORMATION', 'NUMBERS', 'CUSTOM' ], "customEntityConfig": { "customDataIdentifiers": [ 'custom_regex_1', 'custom_regex_2' ] } } } ], "maxOutputSize": { "unit": 'unit', "value": 'number' } } } }, tags={ 'tag': 'tag' } )

将配置的模型算法与协作关联后,训练数据提供者必须向其表中添加协作分析规则。此规则允许配置的模型算法关联访问其配置的表。所有贡献的训练数据提供者都必须运行以下代码:

import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association_analysis_rule( membershipIdentifier= 'membership_id', configuredTableAssociationIdentifier= 'configured_table_association_id', analysisRuleType= 'CUSTOM', analysisRulePolicy = { 'v1': { 'custom': { 'allowedAdditionalAnalyses': ['arn:aws:cleanrooms-ml:region:*:membership/*/configured-model-algorithm-association/*''], 'allowedResultReceivers': [] } } } )
注意

由于配置的模型算法关联是不可变的,因此我们建议想要将模型列入许可名单的训练数据提供者在自定义模型配置的前几次迭代中allowedAdditionalAnalyses使用通配符。这样,模型提供者就可以对其代码进行迭代,而无需其他训练提供者在使用数据训练更新后的模型代码之前重新关联。