运行分析任务以识别自定义实体

您可以运行异步分析任务来检测一组或多个文档中的自定义实体。

开始前的准备工作

在检测自定义实体之前，您需要使用自定义实体识别模型（也称为识别器）。有关这些模型的更多信息，请参阅训练自定义实体识别器模型。

使用纯文本注释训练的识别器仅支持纯文本文档的实体检测。使用 PDF 文档注释训练的识别器支持纯文本文档、图像、PDF 文件和 Word 文档的实体检测。对于文本文件以外的文件，Amazon Comprehend 会在运行分析之前执行文本提取。有关输入文件的信息，请参阅异步自定义分析的输入。

如果您计划分析图像文件或扫描的 PDF 文档，则您的 IAM 策略必须授予使用两种 Amazon Textract API 方法（DetectDocumentText 和 AnalyzeDocument）的权限。Amazon Comprehend 在文本提取过程中会调用这些方法。有关策略示例，请参阅执行文档分析操作所需的权。

要运行异步分析任务，请执行以下总体步骤：

将这些文档存储在 Amazon S3 存储桶中。
使用 API 或控制台启动分析任务。
监控分析任务的进度。
任务运行完成后，从启动任务时指定的 S3 存储桶中检索分析结果。

主题

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

实时分析输出

分析任务（控制台）