使用 Amazon SageMaker Ground Truth 任务 - Amazon Lookout for Vision

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon SageMaker Ground Truth 任务

标注图像可能会花费大量时间。例如,在异常周围精确绘制掩码可能会花费数十秒。如果有数百张图像,则可能需要几个小时才完成标注。除了自己给图片贴标签之外,还可以考虑使用 Amazon G SageMaker round Truth。

借助 Amazon G SageMaker round Truth,你可以使用 Amazon Mechanical Turk(你选择的供应商公司)的工作人员或内部的私人员工来创建一组带标签的图像。有关更多信息,请参阅使用 Amazon G SageMaker round Truth 为数据添加标签

使用 Amazon Mechanical Turk 需要付费。此外,完成 Amazon Ground Truth 标注作业可能需要几天时间。如果存在成本问题,或者您需要快速训练模型,我们建议使用 Amazon Lookout for Vision 控制台来标注图像。

您可以使用 Amazon G SageMaker round Truth 标签作业来标记适用于图像分类模型和图像分割模型的图片。任务完成后,您应使用输出清单文件创建 Amazon Lookout for Vision 数据集。

图像分类

要为图像分类模型标注图像,请为图像分类(单标签)任务创建标注作业。

图像分割

要为图像分割模型标注图像,请为图像分类(单标签)任务创建标注作业。然后,将该作业链接起来,从而为图像语义分割任务创建标注作业。

您也可以使用标注作业为图像分割模型创建部分清单文件。例如,您可以使用图像分类(单标签)任务对图像进行分类。在使用该作业的输出创建 Lookout for Vision 数据集后,应使用 Amazon Lookout for Vision 控制台向数据集图像添加分割掩码和异常标签。

使用 Amazon G SageMaker round Truth 为图片贴标

以下过程展示了如何使用 Amazon G SageMaker round Truth 图片标签任务为图片添加标签。该过程会创建一个图像分类清单文件,然后可选择将图像标注任务链接起来,从而创建图像分割清单文件。如果希望您的项目采用单独的测试数据集,请重复此过程,以便为测试数据集创建清单文件。

使用 Amazon G SageMaker round Truth(控制台)为图片添加标签
  1. 按照创建标注作业(控制台)中的说明,为图像分类(单标签) 任务创建 Ground Truth 作业。

    1. 在步骤 10 中,从任务类别下拉菜单中选择图像,然后选择图像分类(单标签)作为任务类型。

    2. 在步骤 16 中,在图像分类(单标签)标注工具部分,添加两个标签:正常异常

  2. 等待工作人员完成图像分类。

  3. 如果要为图像分割模型创建数据集,请执行以下操作。否则,转至步骤 4。

    1. 在 Amazon G SageMaker round Truth 控制台中,打开标注任务页面。

    2. 选择您之前创建的作业。这会启用操作菜单。

    3. 操作菜单中,选择链接。此时将打开作业详细信息页面。

    4. 任务类型中,选择语义分割

    5. 选择下一步

    6. 语义分割标注工具部分,为您希望模型发现的每种异常类型添加异常标签。

    7. 选择创建

    8. 等待工作人员标注您的图像。

  4. 打开 Ground Truth 控制台并打开标注作业页面。

  5. 如果要创建图像分类模型,请选择您在步骤 1 中创建的作业。如果要创建图像分割模型,请选择您在步骤 3 中创建的作业。

  6. 标注作业摘要中,打开输出数据集位置中的 S3 位置。记下清单文件的位置,应该是 s3://output-dataset-location/manifests/output/output.manifest

  7. 如果要为测试数据集创建清单文件,请重复此过程。否则,请按照创建数据集中的说明操作,使用清单文件创建数据集。

创建数据集

通过此过程,可以使用您在 使用 Amazon G SageMaker round Truth 为图片贴标 步骤 6 中记下的清单文件,在 Lookout for Vision 项目中创建一个数据集。清单文件会为单数据集项目创建训练数据集。如果您希望您的项目拥有单独的测试数据集,则可以运行另一个 Amazon G SageMaker round Truth 任务来为测试数据集创建清单文件。或者,您可以自己创建清单文件。您也可以从 Amazon S3 桶或自己的本地计算机,向测试数据集中导入图像。(可能需要标注这些图像,然后才能训练模型)。

此过程将假设您的项目没有任何数据集。

使用 Lookout for Vision 创建数据集(控制台)
  1. 打开亚马逊 Lookout for Vision 控制台 https://console.aws.amazon.com/lookoutvision/,网址为。

  2. 选择开始

  3. 在左侧导航窗格中,选择项目

  4. 选择要添加到哪一个项目,以便与清单文件一起使用。

  5. 工作原理部分,选择创建数据集

  6. 选择单数据集选项卡或单独的训练数据集和测试数据集选项卡,然后按照步骤进行操作。

    Single dataset
    1. 选择创建单个数据集

    2. 图像源配置部分,选择导入由 G SageMaker round Truth 标记的图像

    3. 对于 .manifest 文件位置,请输入您在 使用 Amazon G SageMaker round Truth 为图片贴标 步骤 6 中记下的清单文件位置。

    Separate training and test datasets
    1. 选择创建训练数据集和测试数据集

    2. 训练数据集详细信息部分,选择导入 SageMaker由 Ground Truth 标注的图像

    3. .manifest 文件位置中,输入您在 使用 Amazon G SageMaker round Truth 为图片贴标 步骤 6 中记下的清单文件位置。

    4. 测试数据集详细信息部分,选择导入 SageMaker 由 Ground Truth 标注的图像

    5. .manifest 文件位置中,输入您在 使用 Amazon G SageMaker round Truth 为图片贴标 步骤 6 中记下的清单文件位置。请记住,测试数据集需要单独的清单文件。

  7. 选择提交

  8. 按照 训练您的模型 中的步骤,训练您的模型。