Supporto multimodale per Amazon Nova - Amazon Nova

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Supporto multimodale per Amazon Nova

I modelli di comprensione di Amazon Nova sono modelli di comprensione multimodali, il che significa che supportano input multimodali come immagini, video e documenti per inferire e rispondere a domande in base al contenuto fornito. I modelli Amazon Nova sono dotati di nuove funzionalità di visione che consentono al modello di comprendere e analizzare immagini, documenti e video, realizzando così casi d'uso di comprensione multimodale.

La sezione seguente descrive le linee guida per lavorare con immagini, documenti e video in Amazon Nova. Queste includono le strategie di preelaborazione utilizzate, esempi di codice e le limitazioni pertinenti da considerare.

Tipo di contenuto supportato per modalità

Le seguenti informazioni descrivono in dettaglio i formati di file supportati dal file multimediale e il metodo di input accettato.

Tipo di file multimediale

Formati di file supportati

Metodo di input

Strategia di analisi

Immagine

PNG, JPG, JPEG, GIF, WebP

Base64

URI Amazon S3

Comprensione della visione delle immagini

Documento di testo

(Solo API Converse)

CSV, XLS, XLSX, HTML, TXT, MD, DOC

Byte

URI Amazon S3

Comprensione testuale solo dal documento.

Documento multimediale

(Solo Converse API)

PDF, DOCX

Byte

URI Amazon S3

Testo con Image Understanding interlacciato

Video

MP4, MOV, MKV, WebM, FLV, MPEG, MPG, WMV, 3GP

Base64

URI Amazon S3

Comprensione della visione video

Nota

Puoi includere fino a cinque file dal tuo computer o 1000 file da Amazon S3. Ogni file non deve pesare più di 1 GB quando viene caricato da Amazon S3. La dimensione totale dei file caricati non può superare i 25 MB quando si carica dal computer o 2 GB quando si carica da Amazon S3.

Poiché il limite di payload complessivo è di 25 MB, assicurati di tenere conto del sovraccarico di base64. Durante il lavoro, ricordate che le librerie e i framework mantengono la memoria e che i contenuti multimediali trasmessi possono accumularsi rapidamente. Quando si utilizza un video, specificare un s3Location dovrebbe risolvere molti problemi di archiviazione.

Nota

L'elaborazione di video e documenti di grandi dimensioni richiede tempo, indipendentemente dal metodo di immissione. Se boto3 SDK scade in attesa di una risposta da parte di boto3 Amazon Bedrock, assicurati di avere impostato un valore read_timeout appropriato e di aver aggiornato boto3 almeno alla versione 1.38.