DocumentReaderConfig - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

DocumentReaderConfig

主题检测任务的输入属性。

目录

DocumentReadAction

此枚举字段将以两个适用于 PDF 的值开头:

  • TEXTRACT_DETECT_DOCUMENT_TEXT-服务电话 DetectDocumentText对于每页 PDF 文档。

  • TEXTRACT_ANALYZE_DOCUMENT-服务电话 AnalyzeDocument 对于每页 PDF 文档。

类型: 字符串

有效值: TEXTRACT_DETECT_DOCUMENT_TEXT | TEXTRACT_ANALYZE_DOCUMENT

必需: 是

DocumentReadMode

此枚举字段提供两个值:

  • SERVICE_DEFAULT-使用服务默认值读取文档。对于数字 PDF,这意味着使用内部解析器而不是 Textract API

  • FORCE_DOCUMENT_READ_ACTION-始终使用指定的动作 DocumentReadAction,包括数字 PDF。

类型: 字符串

有效值: SERVICE_DEFAULT | FORCE_DOCUMENT_READ_ACTION

必需: 否

FeatureTypes

指定应如何处理输入文件中的文本:

类型: 字符串数组

数组成员: 最少 1 项。最多 2 项。

有效值: TABLES | FORMS

必需: 否

另请参阅

有关在特定语言的 AWS 软件开发工具包中使用此 API 的更多信息,请参阅以下内容: