本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用图像创建训练和测试数据集
可以从具有单个数据集的项目或者具有单独的训练和测试数据集的项目开始。如果从单个数据集开始,Amazon Rekognition Custom Labels 会在训练期间拆分该数据集,来为项目创建训练数据集 (80%) 和测试数据集 (%20)。如果想让 Amazon Rekognition Custom Labels 决定使用哪些图像进行训练和哪些图像进行测试,请从单个数据集开始。为了能够完全控制训练、测试和性能调整,建议您使用单独的训练数据集和测试数据集开始您的项目。
可以通过从以下位置之一导入图像来为项目创建训练和测试数据集:
如果使用单独的训练和测试数据集来开始项目,可以为每个数据集使用不同的源位置。
根据导入图像的方式,您的图像可能没有标签。例如,从本地计算机导入的图像就没有标签。从 Amazon G SageMaker round Truth 清单文件导入的图片已贴上标签。您可以使用 Amazon Rekognition Custom Labels 控制台添加、更改和分配标签。有关更多信息,请参阅 标注图像。
如果上传图像时出现错误、图像丢失或图像中缺少标签,请阅读调试失败的模型训练。
有关数据集的更多信息,请参阅管理数据集。
创建训练和测试数据集 (SDK)
您可以使用 AWS SDK 创建训练和测试数据集。
训练数据集
您可以通过以下方式使用 AWS SDK 创建训练数据集。
CreateDataset与您提供的 Amazon Sagemaker 格式清单文件一起使用。有关更多信息,请参阅 创建清单文件。有关代码示例,请参阅 使用 G SageMaker round Truth 清单文件 (SDK) 创建数据集。
-
使用
CreateDataset
复制现有的 Amazon Rekognition Custom Labels 数据集。有关代码示例,请参阅 使用现有数据集创建数据集 (SDK)。 使用创建空数据集
CreateDataset
并在以后使用添加数据集条目UpdateDatasetEntries。要创建空数据集,请参阅向项目添加数据集。要向数据集中添加图像,请参阅添加更多图像 (SDK)。需要先添加数据集条目,然后才能训练模型。
测试数据集
您可以通过以下方式使用 AWS SDK 创建测试数据集:
CreateDataset与您提供的 Amazon Sagemaker 格式清单文件一起使用。有关更多信息,请参阅 创建清单文件。有关代码示例,请参阅 使用 G SageMaker round Truth 清单文件 (SDK) 创建数据集。
-
使用
CreateDataset
复制现有的 Amazon Rekognition Custom Labels 数据集。有关代码示例,请参阅 使用现有数据集创建数据集 (SDK)。 使用
CreateDataset
创建一个空数据集,稍后使用UpdateDatasetEntries
添加数据集条目。要创建空数据集,请参阅向项目添加数据集。要向数据集中添加图像,请参阅添加更多图像 (SDK)。需要先添加数据集条目,然后才能训练模型。将训练数据集拆分为单独的训练数据集和测试数据集。先使用
CreateDataset
创建一个空的测试数据集。然后通过调用,将 20% 的训练数据集条目移到测试数据集中DistributeDatasetEntries。要创建空数据集,请参阅向项目添加数据集 (SDK)。要拆分训练数据集,请参阅分配训练数据集 (SDK)。