确定数据集用途 - Rekognition

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

确定数据集用途

如何标注项目中的训练和测试数据集决定了所创建的模型的类型。使用 Amazon Rekognition Custom Labels,可以创建执行以下操作的模型。

查找物体、场景和概念

该模型可对与整个图像相关的物体、场景和概念进行分类。

您可以创建两种类型的分类模型:图像分类多标签分类。这两种类型的分类模型都会从用于训练的整套标签中查找一个或多个匹配的标签。训练和测试数据集都需要至少两个标签。

图像分类

该模型可将图像归类为属于一组预定义的标签。例如,您可能需要一个模型来确定图像中是否包含生活空间。下图可能具有 living_space 图像级标签。

带壁炉的舒适起居室和俯瞰后院露台的大窗户。中性色调,木质装饰。

对于这种类型的模型,请为每个训练和测试数据集图像添加一个图像级标签。如需查看示例项目,请参阅图像分类

多标签分类

该模型可将图像分为多个类别,例如花的类型以及是否有叶子。例如,下图可能具有 mediterranean_spurgeno_leaves 图像级标签。

特写镜头是一团绿色的荚莲花,上面有紧密堆满的小花。

对于这种类型的模型,请将每个类别的图像级标签分配给训练和测试数据集图像。如需查看示例项目,请参阅多标签图像分类

分配图像级标签

如果图像存储在 Amazon S3 存储桶中,则可以使用文件夹名称自动添加图像级标签。有关更多信息,请参阅 从 Amazon S3 存储桶导入图像。您也可以在创建数据集后向图像添加图像级标签。有关更多信息,请参阅为图像分配图像级标签。您可以根据需要添加新标签。有关更多信息,请参阅 管理标签

查找物体位置

要创建预测图像中物体位置的模型,您需要为训练和测试数据集中的图像定义物体位置边界框和标签。边界框是紧紧围绕物体的方框。例如,下图显示了 Amazon Echo 和 Amazon Echo Dot 周围的边界框。每个边界框都有分配的标签(Amazon EchoAmazon Echo Dot)。

木制表面上有两个 Amazon 智能扬声器,一个带有绿色边框和一个蓝色的边框。

要查找物体位置,数据集至少需要一个标签。在模型训练期间,会自动创建另一个标签,用于代表图像上边界框之外的区域。

分配边界框

创建数据集时,可以包含图像的边界框信息。例如,您可以导入包含边界框的 SageMaker Ground Truth 格式的清单文件。或者,也可以在创建数据集之后添加边界框。有关更多信息,请参阅 使用边界框标注物体。您可以根据需要添加新标签。有关更多信息,请参阅 管理标签

查找品牌位置

如果要查找品牌(例如徽标和动画角色)的位置,则可以为训练数据集图像使用两种不同类型的图像。

  • 仅包含徽标的图像。每张图像都需要一个代表徽标名称的图像级标签。例如,下图的图像级标签可以是 Lambda

    橙色背景上的白色 Lambda 徽标。
  • 在自然位置(例如足球比赛或架构图)包含徽标的图像。每张训练图像都需要围绕每个徽标实例的边界框。例如,下图显示了一张架构图,Lamb AWS da 和 Amazon Pinpoint 徽标周围标有标有边界框。

    Diagrom 工作流程显示 Lamb AWS da 服务将用户活动输入亚马逊 Pinpoint 以获取推荐。

建议您不要在训练图像中混用图像级标签和边界框。

测试图像必须在您想要查找的品牌实例周围有边界框。只有当训练图像包含带标签的边界框时,才能拆分训练数据集来创建测试数据集。如果训练图像只有图像级标签,则必须创建一个测试数据集,该数据集中包含的图像必须具有带标签的边界框。如果训练模型来查找品牌位置,请根据为图像添加标签的方式执行以下操作:使用边界框标注物体为图像分配图像级标签

品牌检测 示例项目展示了 Amazon Rekognition Custom Labels 如何使用带标签的边界框来训练查找物体位置的模型。

不同模型类型的标签要求

根据下表确定如何为图像添加标签。

可以在单个数据集中混合带图像级标签的图像和包含带标签的边界框的图像。在这种情况下,Amazon Rekognition Custom Labels 会选择是创建图像级模型还是创建物体位置模型。

示例 训练图像 测试图像

图像分类

每张图像 1 个图像级标签

每张图像 1 个图像级标签

多标签分类

每张图像多个图像级标签

每张图像多个图像级标签

查找品牌位置

图像级标签(也可以使用带标签的边界框)

带标签的边界框

查找物体位置

带标签的边界框

带标签的边界框