使用 Bedrock 数据自动化的先决条件 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Bedrock 数据自动化的先决条件

BDA 的文件需要满足某些要求才能进行处理。下表显示了不同文件类型的要求。

文件要求

需求描述

需求详情

(控制台)每个文档文件的最大页数

20

启用拆分器时每个文档的最大页数

3000

(控制台)最大文件大小 (MB)

200

最大文件大小 (MB)

500

支持的文件格式

PDF、TIFF、JPEG、PNG、DOCX

PDF 特定限制

最大高度和宽度为 40 英寸和 9000 个点。 PDFs 无法使用密码保护。 PDFs 可以包含 JPEG 2000 格式的图像。

文档旋转和图像大小

BDA 支持所有平面内文档旋转,例如 45 度平面内旋转。

BDA 支持四面分辨率小于或等于 10000 像素的图像。

文本对齐方式

文本可以在文档中水平对齐。无论文档的旋转程度如何,都可以阅读水平排列的文本。BDA 不支持文档中的垂直文本(垂直书写的文本,在日语和中文等语言中很常见)对齐。

字符大小

要检测的文本的最小高度为 15 像素。在 150 DPI 时,这将与 8 点字体相同。

角色类型

BDA 支持手写和打印字符识别。

注意

要处理 DOCX 文件,请将它们转换为 PDFs。这意味着页码映射不适用于 DOCX 文件。如果选择了 JSON+ 选项和页面粒度,则转换后的图像 PDFs 将上传到您的输出存储桶。

图像文件要求

需求描述

需求详情

最大文件大小 (MB)

5

最大分辨率

8k

支持的文件格式

JPEG、PNG

视频文件要求

需求描述

需求详情

最大文件大小 (MB)

10240

最大视频时长(分钟)

240

支持的文件格式

MP4,带有 H.264 的 MOV、H.265/HEVC、、视频编解码器 VP8 VP9

每个项目的最大视频蓝图数

1

每次启动推理请求的最大视频蓝图数

1

最小分辨率

224

最大分辨率

7680

最低帧率(每秒帧数)

1

最大帧率(每秒帧数)

60

音频文件要求

需求描述

需求详情

最低音频采样率 (Hz)

8000

最大音频采样率 (Hz)

48000

最大文件大小 (MB)

2048

最大音频长度(分钟)

240

最小音频长度(毫秒)

500

支持的文件格式

AMR、FLAC、M4A、、Ogg、WAV MP3

每个项目的最大音频蓝图数

1

每个 “开始推理” 请求的最大音频蓝图数

1