使用 Bedrock 資料自動化的先決條件 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 Bedrock 資料自動化的先決條件

BDA 的檔案必須符合特定要求,才能進行處理。下表顯示不同檔案類型的這些要求。

文件檔案需求

要求描述

要求詳細資訊

(主控台) 每個文件檔案的頁面數上限

20

啟用分割器時,每個文件的最大頁數

3000

(主控台) 檔案大小上限 (MB)

200

檔案大小上限 (MB)

500

支援的檔案格式

PDF、TIFF、JPEG、PNG、DOCX

PDF 特定限制

高度和寬度上限為 40 英吋和 9000 點。PDFs無法受密碼保護。PDFs可包含 JPEG 2000 格式的影像。

文件輪換和影像大小

BDA 支援所有平面內文件輪換,例如 45 度平面內輪換。

BDA 支援所有方解析度小於或等於 10000 像素的影像。

文字對齊

文字可以在文件中水平對齊。無論文件的輪換程度如何,都可以讀取水平排列的文字。BDA 不支援文件中的垂直文字 (垂直寫入的文字,在日文和中文等語言中很常見) 對齊。

字元大小

要偵測的文字最小高度為 15 像素。在 150 DPI 時,這與 8 點字型相同。

字元類型

BDA 支援手寫和列印字元辨識。

注意

若要處理 DOCX 檔案,它們會轉換為 PDFs。這表示頁碼映射不適用於 DOCX 檔案。如果選取 JSON+ 選項和頁面精細程度,轉換PDFs 影像將上傳至輸出儲存貯體。

映像檔案需求

要求描述

要求詳細資訊

檔案大小上限 (MB)

5

最大解析度

8k

支援的檔案格式

JPEG、PNG

影片檔案需求

要求描述

要求詳細資訊

檔案大小上限 (MB)

10240

影片長度上限 (分鐘)

240

支援的檔案格式

MP4、MOV 搭配 H.264、H.265/HEVC、VP8, VP9視訊轉碼器

每個專案的影片藍圖上限

1

每個啟動推論請求的影片藍圖上限

1

最低解析度

224

解析度上限

7680

最低影格率 (每秒影格數)

1

最高影格率 (每秒影格數)

60

音訊檔案需求

要求描述

要求詳細資訊

音訊取樣率下限 (Hz)

8000

最大音訊取樣率 (Hz)

48000

檔案大小上限 (MB)

2048

音訊長度上限 (分鐘)

240

音訊長度下限 (毫秒)

500

支援的檔案格式

AMR、FLAC、M4A, MP3、Ogg、WAV

每個專案的音訊藍圖上限

1

每個啟動推論請求的音訊藍圖上限

1