自定义分类 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

自定义分类

使用自定义分类将您的文档组织成您定义的类别(类)中。自定义分类分两个步骤。首先,训练自定义分类模型(也称为分类器)以识别您感兴趣的类。然后,您可以使用模型对任意数量的文档集进行分类。

例如,您可以对支持请求的内容进行分类,以便将请求发送给适当的支持团队。或者,您可以对从客户那里收到的电子邮件进行分类,以便根据客户请求的类型提供指导。您可以将 Amazon Comprehend 与 Amazon Transcribe 结合使用,将语音转换为文本,然后对来自支持电话的请求进行分类。

您可以同步(实时)地对单个文档运行自定义分类,也可以启动异步作业来对一组文档进行分类。您的账户中可以有多个自定义分类器,每个分类器都使用不同的数据进行训练。自定义分类支持多种输入文档类型,例如纯文本、PDF、Word 和图像。

提交分类作业时,您可以根据需要分析的文档类型选择要使用的分类器模型。例如,要分析纯文本文档,您可以通过使用纯文本文档训练的模型来获得最准确的结果。要分析半结构化文档(例如 PDF、Word、图像、Amazon Textract 输出或扫描文件),您可以使用原生文档训练的模型来获得最准确的结果。