创建流式标注作业 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建流式标注作业

通过流式标注作业,您可以将各个数据对象实时发送到持续运行的流式标注作业。要创建流式标注作业,必须创建 Amazon SNS 输入主题,并在 SnsDataSourceCreateLabelingJob 参数 InputConfig 中指定此主题。如果您想实时接收标签数据,还可以创建 Amazon SNS 输出主题,并在 OutputConfig 中指定此主题。

重要

如果您是 Ground Truth 流式标注作业的新用户,建议您在创建流式标注作业前先行查看Ground Truth 流式标注作业

使用以下部分创建您需要并可用于创建流式标注作业的资源:

  • 按照创建 Amazon SNS 输入和输出主题中的步骤操作,了解如何创建具有 Ground Truth 流式标注作业所需权限的 SNS 主题。您的 SNS 主题必须与您的标签任务在同一个 AWS 区域创建。

  • 请参阅为端点订阅 Amazon SNS 输出主题,了解如何设置一个端点,以便每次完成标注任务时都能在指定端点接收标注任务输出数据。

  • 要了解如何配置 Amazon S3 存储桶以向 Amazon SNS 输入主题发送通知,请参阅设置 Amazon S3 存储桶事件通知

  • 可选择在输入清单中添加您希望在标注作业开始后立即标注的数据对象。有关更多信息,请参阅创建清单文件(可选)

  • 创建标注作业还需要其他资源,例如 IAM 角色、Amazon S3 存储桶、工作人员任务模板和标签类别。这些资源在关于创建标注作业的 Ground Truth 文档中有所描述。有关更多信息,请参阅创建标注作业

    重要

    创建标注作业时,必须提供 IAM 执行角色。将 AWS 托管策略附加AmazonSageMakerGroundTruthExecution到此角色,以确保其拥有执行标签任务所需的权限。

当您提交创建流式标注作业的请求时,标注作业的状态是 Initializing。标注作业处于活动状态后,状态将更改为 InProgress。当标注作业处于 Initializing 状态时,不要向其发送新的数据对象,也不要试图停止标注作业。一旦状态更改为 InProgress,您就可以开始使用 Amazon SNS 和 Amazon S3 配置发送新的数据对象。