使用Amazon Comprehend 模型进行版本控制 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用Amazon Comprehend 模型进行版本控制

人工智能和机器学习 (AI/ML) 都是关于快速实验的。使用 Amazon Comprehend,您可以训练和构建模型,使用这些模型来深入了解您的数据。通过模型版本控制,当您提供更多或不同的数据集时,您可以跟踪建模历史记录以及与模型运行结果相关的分数。您可以将版本控制与自定义分类模型或自定义实体识别模型一起使用。随着时间的推移查看不同的版本,你可以深入了解它们的成功程度,并深入了解你使用了哪些参数来达到成功状态。

当您训练现有自定义分类器模型或实体识别模型的新版本时,您只需从模型详细信息页面创建一个新版本,然后为您填充所有详细信息即可。新版本将与您之前的模型同名(我们称之为 versionID),尽管您将在创建过程中为其指定一个唯一的版本名称。向模型添加新版本时,可以在模型详细信息页面的一个视图中查看所有先前版本及其详细信息。通过版本控制,您可以在更改训练数据集时看到模型性能是如何变化的。

创建新的自定义分类器版本(控制台)
  1. 登录到,AWS Management Console然后通过以下址打开 Amazon Comprehend控制台 Amaon Compre https://console.aws.amazon.com/comprehend/

  2. 从左侧菜单中选择 “自定义”,然后选择 “自定义分类”。

  3. 分类器列表中,选择要创建新版本的自定义模型的名称。将显示自定义模型的详细信息页面。

  4. 在右上角,选择创建新模型。 屏幕随即打开,其中包含来自父项自定义分类模型的预先填充的详细信息。

  5. 在 “版本名称” 下,为新版本添加一个唯一的名称。

  6. 在版本详细信息下,您可以更改与新模型相关的标签的语言和数量。

  7. 在 “数据规范” 部分下,配置要如何向新版本提供数据,确保提供完整数据,包括先前模型的文档和新文档。您可以更改分类器模式(单标签或多标签)、数据格式(CSV 文件、增强清单)、训练数据集测试数据集(自动拆分或自定义测试数据配置)。

  8. (可选)更新输出数据的 S3 位置

  9. 访问权限下,创建或使用现有的 IAM 角色。

  10. (可选)更新您的 VPC 设置

  11. (可选)向新版本添加新版本以帮助跟踪其详细信息。

    有关创建自定义分类器的更多信息,请选择创建自定义分类器

创建新的自定义实体识别器版本(控制台)
  1. 登录到,AWS Management Console然后通过以下址打开 Amazon Comprehend控制台 Amaon Compre https://console.aws.amazon.com/comprehend/

  2. 从左侧菜单中选择 “自定义”,然后选择 “自定义实体识别”。

  3. 识别器型号列表中,选择要创建新版本的识别器的名称。将显示详细信息页面。

  4. 在右上角,选择 “训练新版本”。 屏幕打开,其中包含来自父实体识别器的预先填充的详细信息。

  5. 在 “版本名称” 下,为新版本添加一个唯一的名称。

  6. 在 “自定义实体类型” 下,添加您希望识别器在数据集中识别的自定义标签或标签,然后选择添加类型。从您提供的注释或实体列表中选择自定义实体类型。然后,识别器将在运行作业时使用所有包含的实体类型来识别数据集中的实体。如果每个实体类型使用多个单词,则必须使用大写字母并由和下划线分隔。最多允许 25 种类型。

  7. (可选)选择 Recognizer 加密,在处理作业时对存储卷中的数据进行加密。

  8. 在训练数据部分下,指定注释和数据格式详细信息(CSV 文件、增强型清单)(单标签或多标签)、数据格式(CSV、增强型清单)、您的训练数据集和测试数据集(自动拆分或您的自定义测试数据配置)。

  9. (可选)更新输出数据的 S3 位置

  10. 访问权限下,创建或使用现有的 IAM 角色。

  11. (可选)更新您的 VPC 设置

  12. (可选)向新版本添加新版本以帮助跟踪其详细信息。

要了解有关自定义实体识别器的更多信息,请参阅自定义实体识别使用控制台创建自定义实体识别器