使用图像创建训练和测试数据集 - Rekognition

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用图像创建训练和测试数据集

可以从具有单个数据集的项目或者具有单独的训练和测试数据集的项目开始。如果从单个数据集开始,Amazon Rekognition Custom Labels 会在训练期间拆分该数据集,来为项目创建训练数据集 (80%) 和测试数据集 (%20)。如果想让 Amazon Rekognition Custom Labels 决定使用哪些图像进行训练和哪些图像进行测试,请从单个数据集开始。为了能够完全控制训练、测试和性能调整,建议您使用单独的训练数据集和测试数据集开始您的项目。

可以通过从以下位置之一导入图像来为项目创建训练和测试数据集:

如果使用单独的训练和测试数据集来开始项目,可以为每个数据集使用不同的源位置。

根据导入图像的方式,您的图像可能没有标签。例如,从本地计算机导入的图像就没有标签。从 Amazon G SageMaker round Truth 清单文件导入的图片已贴上标签。您可以使用 Amazon Rekognition Custom Labels 控制台添加、更改和分配标签。有关更多信息,请参阅 标注图像

如果上传图像时出现错误、图像丢失或图像中缺少标签,请阅读调试失败的模型训练

有关数据集的更多信息,请参阅管理数据集

创建训练和测试数据集 (SDK)

您可以使用 AWS SDK 创建训练和测试数据集。

训练数据集

您可以通过以下方式使用 AWS SDK 创建训练数据集。

测试数据集

您可以通过以下方式使用 AWS SDK 创建测试数据集: