Document - Amazon Textract

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Document

输入文档,可以是字节或作为 S3 对象。

您可以使用Bytes财产。例如,您应使用Bytes属性来传递从本地文件系统加载的文档。通过使用Bytes属性必须采用 base64 编码。如果您使用 AWS 开发工具包调用 Amazon Textract API 操作,则代码可能不需要对文档文件字节进行编码。

您可以使用存储在 S3 存储桶中的图像传递给 Amazon Textract API 操作。S3Object财产。存储在 S3 存储桶中的文档不需要 base64 编码。

包含 S3 对象的 S3 存储桶的 AWS 区域必须与您用于 Amazon Textract 操作的 AWS 区域匹配。

如果您使用 AWS CLI 调用 Amazon Textract 操作,则不支持使用字节属性传递图像字节。您必须先将文档上传到 Amazon S3 存储桶,然后再使用 S3Object 属性调用操作。

如果 Amazon Textract 处理 S3 对象,用户必须具有访问 S3 对象的权限。

目录

Bytes

base64 编码的文档字节的 blob。以 BLOB 字节为单位提供的文档的最大大小为 5 MB。文档字节必须采用 PNG 或 JPEG 格式。

如果您使用 AWS 开发工具包调用 Amazon Textract,则可能不需要对使用Bytes字段中返回的子位置类型。

类型: Base64 编码的二进制数据对象

长度约束:最小长度为 1。最大长度为 10485760。

必填项:否

S3Object

将 S3 对象标识为文档源。存储在 S3 存储桶中的文档的最大大小为 5 MB。

类型:S3Object 对象

必填项:否

另请参阅

有关在特定语言的AWS软件开发工具包中使用此 API 的更多信息,请参阅以下内容: