运行异步作业 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

运行异步作业

训练自定义分类器后,您可以使用异步作业批量分析大型文档或多个文档。

自定义分类接受各种输入文档类型。有关更多信息,请参阅 异步自定义分析的输入

如果您计划分析图像文件或扫描的 PDF 文档,则您的 IAM 策略必须授予使用两种 Amazon Textract API 方法(DetectDocumentText 和 AnalyzeDocument)的权限。Amazon Comprehend 在文本提取过程中会调用这些方法。有关策略示例,请参阅 执行文档分析操作所需的权

要使用纯文本模型对半结构化文档(图像、PDF 或 Docx 文件)进行分类,请使用 one document per file 输入格式。此外,请在StartDocumentClassificationJob请求中包含该DocumentReaderConfig参数。