쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

Multimodal support for Amazon Nova

포커스 모드
Multimodal support for Amazon Nova - Amazon Nova
이 페이지는 귀하의 언어로 번역되지 않았습니다. 번역 요청

Amazon Nova Understanding Models are multimodal understanding models, that means they support multimodal inputs such as images, videos, and documents to infer and answer question based on the content provided. The Amazon Nova model family is equipped with novel vision capabilities that enable the model to comprehend and analyze images, documents, and videos thereby realizing multimodal understanding use cases.

The following section outline guidelines for working with images, documents, and videos in Amazon Nova. These include preprocessing strategies employed, code examples, and relevant limitations to consider.

Supported content type by modality

The following information details the file formats supported by media file and the accepted input method.

Media File Type

File Formats supported

Input Method

Parsing Strategy

Image

PNG, JPG, JPEG, GIF, WebP

Base64

(Overall Payload should be less than 25MB)

Image Vision Understanding

Text Document

(Converse API Only)

csv, xls, xlsx, html, txt, md, doc

Bytes

(Size limit per document to be less than 4.5MB)

Textual Understanding from the document ONLY.

Media Document

(Converse API Only)

pdf, docx

Bytes

(18MB Size limit across all documents)

Text with interleaved Image Understanding

Video

(Optimized for videos less than 30 minutes long)

MP4, MOV, MKV, WebM, FLV, MPEG, MPG, WMV, 3GP

Base64 - (Recommended for payload size less than 25MB)

Amazon S3 URI - (Recommended for payloads greater than 25MB, up to 1GB)

Video Vision Understanding

Note

Because 25MB is the overall payload limit, ensure that you account for the base64 overhead. While working, remember that libraries and frameworks maintain memory, and passed media content can quickly add up. When using video, specifying an s3Location should alleviate many storage issues.

Note

Large videos and documents take time to process, regardless of input method. If boto3 SDK times-out while waiting for a response from Amazon Bedrock, ensure that you have an appropriate read_timeout value set.

이 페이지에서

프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.