训练识别器模型 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

训练识别器模型

自定义实体识别器仅标识训练模型时包含的实体类型。它不会自动包含预设的实体类型。如果您还想标识预设的实体类型,例如 LOCATION、DATE 或 PERSON,则需要为这些实体提供额外的训练数据。

当您使用带注释的 PDF 文件创建自定义实体识别器时,可以将识别器与各种输入文件格式配合使用:纯文本、图像文件(JPG、PNG、TIFF)、PDF 文件和 Word 文档,无需预处理或文档拼合。亚马逊 Comprehend 不支持对图片文件或 Word 文档进行注释。

注意

使用带注释的 PDF 文件的自定义实体识别器仅支持英文文档。

创建自定义实体识别器后,您可以使用DescribeEntityRecognizeroperation. OnceStatus字段的子位置类型TRAINED,识别器模型已准备好用于自定义实体识别。