使用亚马逊 Comprehend 进行模型版本控制 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用亚马逊 Comprehend 进行模型版本控制

人工智能和机器学习(AI/ML)完全是关于快速实验。借助 Amazon Comprehend,您可以训练和构建模型,以便深入了解您的数据。借助模型版本控制,您可以在提供更多或不同的数据集时跟踪与模型运行结果相关的建模历史记录和分数。您可以将版本控制与自定义分类模型或自定义实体识别模型配合使用。随着时间的推移,看看你的不同版本,你可以深入了解它们的成功程度,并深入了解你用来达到成功状态的参数。

当您训练现有自定义分类器模型或实体识别模型的新版本时,您所需要做的就是从模型详细信息页面创建一个新版本,然后为您填充所有详细信息。新版本将与之前的模型(我们称之为 versionID)具有相同的名称,尽管您在创建时会为其指定一个唯一的版本名称。向模型添加新版本时,可以在模型详细信息页面的一个视图中查看所有以前的版本及其详细信息。通过版本控制,您可以看到模型性能在对训练数据集进行更改时会发生怎样的变化。

创建新的自定义分类器版本(控制台)

  1. 登录到AWS Management Console打开Amazon Compreh.

  2. 从左侧菜单中,选择自定义然后选择自定义分类.

  3. 分类器列表中,选择要从中创建新版本的自定义模型的名称。此时将显示自定义模型详细信息页面。

  4. 在右上角,选择创建新模型。此时将打开一个屏幕,其中包含来自父自定义分类模型的预填充详细信息。

  5. UNDER版本名称为新版本添加唯一名称。

  6. 在版本详细信息下,您可以更改与新模型关联的语言和标签数量。

  7. 数据规范部分配置您希望如何向新版本提供数据 — 请确保提供完整数据,包括先前模型中的文档和新文档。您可以更改分类器模式(单标签或多标签)、数据格式(CSV 文件、增强清单)、您的训练数据集,还有你的测试数据集(自动拆分,或您的自定义测试数据配置)。

  8. (可选)更新输出数据的 S3 位置

  9. UNDER访问权限,创建或使用现有的 IAM 角色。

  10. (可选)更新您的 VPC 设置

  11. (可选)向新版本添加标签以帮助跟踪详细信息。

    有关创建自定义分类器的更多信息,请参阅创建自定义分类器

创建新的自定义实体识别程序版本(控制台)

  1. 登录到AWS Management Console打开Amazon Compreh.

  2. 从左侧菜单中,选择自定义然后选择自定义实体识别.

  3. 识别器模型列表中,选择要从中创建新版本的识别程序的名称。此时将显示详细信息页面。

  4. 在右上角,选择训练新版本。将打开一个屏幕,其中包含来自父实体识别器的预填充详细信息。

  5. UNDER版本名称为新版本添加唯一名称。

  6. 在自定义实体类型下,添加您希望识别器在数据集中识别的自定义标签或标签,然后选择添加类型. 从您提供的注释或实体列表中选择自定义实体类型。然后,识别器将在运行作业时使用所有包含的实体类型来标识数据集中的实体。每个实体类型必须是大写字母,如果使用多个单词,则用和下划线分隔。最多允许 25 个类型。

  7. (可选)选择识别器加密在处理作业时对存储卷中的数据进行加密。

  8. 在训练数据部分下,指定注释和数据格式详情(CSV 文件、增强清单)单标签或多标签),数据格式(CSV、增强清单)、你的训练数据集,还有你的测试数据集(自动拆分,或您的自定义测试数据配置)。

  9. (可选)更新输出数据的 S3 位置

  10. UNDER访问权限,创建或使用现有的 IAM 角色。

  11. (可选)更新您的 VPC 设置

  12. (可选)向新版本添加标签以帮助跟踪详细信息。

要了解有关自定义实体识别程序的更多信息,请参阅自定义实体识别使用控制台创建自定义实体识别器.