A 部分:构建、训练和部署亚马逊Fraud Detector 模型 - Amazon Fraud Detector

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

A 部分:构建、训练和部署亚马逊Fraud Detector 模型

在 A 部分中,您可以定义业务用例、定义事件、构建模型、训练模型、评估模型的性能并部署模型。

  • 在此步骤中,您将使用数据模型浏览器将您的业务用例与 Amazon Fraud Detector 支持的欺诈检测模型类型进行匹配。Data Models Explorer 是一款与 Amazon Fraud Detector 控制台集成的工具,可推荐一种模型类型,用于为您的业务用例创建和训练欺诈检测模型。数据模型浏览器还可让您深入了解需要在数据集中包含的必填数据、推荐数据元素和可选数据元素。该数据集将用于创建和训练您的欺诈检测模型。

    在本教程中,您的业务用例是新账户注册。在您指定业务用例后,数据模型浏览器将推荐用于创建欺诈检测模型的模型类型,还将为您提供创建数据集所需的数据元素列表。由于您已经上传了包含新账户注册数据的示例数据集,因此无需创建新的数据集。

    1. 打开AWS管理控制台并登录您的账户。导航到 Amazon Fraud Detec

    2. 在左侧导航窗格中,选择数据模型资源管理器

    3. 数据模型浏览器页面的业务用例下,选择新账户欺诈

    4. Amazon Fraud Detector 显示推荐的模型类型,用于为所选业务用例创建欺诈检测模型。模型类型定义了 Amazon Fraud Detector 将用于训练您的欺诈检测模型的算法、丰富和转换。

      请记下推荐的模型类型。稍后在创建模型时将需要此信息。

    5. 数据模型见解窗格可让您深入了解创建和训练欺诈检测模型所需的必需和推荐数据元素。

      查看您下载的示例数据集,确保其中包含表中列出的所有必填数据元素和一些推荐的数据元素。

      稍后,当您为特定业务用例创建模型时,您将使用提供的见解来创建数据集。

  • 在此步骤中,您可以定义要评估欺诈的业务活动(事件)。定义事件涉及设置数据集中的变量、实体启动事件以及对事件进行分类的标签。在本教程中,您将定义账户注册事件。

    1. 打开AWS管理控制台并登录您的账户。导航到 Amazon Fraud Detec

    2. 在左侧导航窗格中,选择 Events(事件)。

    3. 事件类型页面中,选择创建

    4. 事件类型详细信息下,输入sample_registration作为事件类型名称,并根据需要输入事件的描述。

    5. 对于实体,选择创建实体

    6. 创建实体页面中,输入sample_customer作为实体类型名称。或者,输入实体类型的描述。

    7. 选择 Create entity (创建实体)

    8. 事件变量下,对于选择如何定义此事件的变量选择从训练数据集中选择变量

    9. 对于 IAM 角色,选择创建 IAM 角色

    10. 创建 IAM 角色页面中,输入您将示例数据上传到的 S3 存储桶的名称,然后选择创建角色

    11. 数据位置中,输入示例数据的路径。这是您在上传示例数据后保存的S3 URI路径。路径与此类似:S3://your-bucket-name/example dataset filename.csv.

    12. 请选择 Upload(上传)。

      Amazon Fraud Detector 从您的示例数据文件中提取标题并将其映射为变量类型。映射会显示在控制台中。

    13. 在 “标签-可选” 下的 “标签” 中,选择 “创建新标签”。

    14. 创建标签页面中,输入fraud作为名称。此标签对应于代表示例数据集中欺诈性账户注册的值。

    15. 选择 “创建标签”

    16. 创建第二个标签,然后输入legit作为名称。此标签对应于代表示例数据集中合法账户注册的值。

    17. 选择创建事件类型

  1. 模型页面上,选择添加模型,然后选择创建模型

  2. 对于步骤 1-定义模型细节,输入sample_fraud_detection_model作为模型名称。或者,添加模型的描述。

  3. 对于模型类型,选择在线欺诈洞察模型。

  4. 对于事件类型,选择 sample_registration。这是您在步骤 1 中创建的事件类型。

  5. 历史事件数据中,

    1. 事件数据源中,选择存储在 S3 中的事件数据

    2. 对于 IAM 角色,选择您在步骤 1 中创建的角色。

    3. 训练数据位置中,输入示例数据文件的 S3 URI 路径。

  6. 选择下一步

  1. 模型输入中,将所有复选框保持选中状态。默认情况下,Amazon Fraud Detector 使用历史事件数据集中的所有变量作为模型输入。

  2. 标签分类中,对于欺诈标签,选择欺诈,因为此标签对应于代表示例数据集中欺诈事件的值。对于合法标签,请选择 legit,因为此标签对应于代表示例数据集中合法事件的值。

  3. 对于 “未标注事件” 处理,保留此示例数据集的默认选择 “忽略未标记的事件”

  4. 选择下一步

  5. 查看后,选择创建并训练模型。Amazon Fraud Detector 创建了一个模型并开始训练该模型的新版本。

    模型版本中,状态列表示模型训练的状态。使用示例数据集的模型训练大约需要 45 分钟才能完成。模型训练完成后,状态更改为 “准备部署”。

使用 Amazon Fraud Detector 的一个重要步骤是使用模型分数和性能指标评估模型的准确性。模型训练完成后,Amazon Fraud Detector 使用未用于训练模型的 15% 的数据来验证模型性能,并生成模型性能分数和其他性能指标。

  1. 要查看模型的性能,

    1. 在 Amazon Fraud Detector 的左侧导航窗格中,选择模型

    2. 模型页面中,选择你刚刚训练的模型(sample_fraud_detection_model),然后选择 1.0。这是亚马逊Fraud Detector 为您的模型创建的版本。

  2. 查看模型性能总分以及亚马逊Fraud Detector 为此模型生成的所有其他指标。

    要了解有关此页面上模型性能分数和性能指标的更多信息,请参阅模型分数对性能指标进行建模

    您可以期望所有经过训练的 Amazon Fraud Detector 模型都具有真实的欺诈检测性能指标,这些指标与您在本教程中看到的模型的性能指标类似。

在您查看了经过训练的模型的性能指标并准备好使用它来生成欺诈预测之后,就可以部署该模型了。

  1. 在亚马逊Fraud Detector 控制台的左侧导航窗格中,选择模型

  2. 模型页面中,选择 sample_fraud_detection_m odel,然后选择要部署的特定模型版本。在本教程中,选择 1.0

  3. 模型版本页面上,选择操作,然后选择部署模型版本

  4. 模型版本中,状态显示部署的状态。部署完成后,状态更改为 “活动”。这表明模型版本已激活并可用于生成欺诈预测。B 部分:生成欺诈预测继续完成生成欺诈预测的步骤。