Limiti relativi alla comprensione dei video

Di seguito sono riportate le principali limitazioni del modello, in cui la precisione e le prestazioni del modello potrebbero non essere garantite.

Un video per richiesta: attualmente il modello supporta solo 1 video per richiesta. Alcuni framework e librerie utilizzano la memoria per tenere traccia delle interazioni precedenti. Potrebbe esserci un video che è stato aggiunto in un contesto precedente.
Nessun supporto audio: i modelli sono attualmente addestrati a elaborare e comprendere i contenuti video esclusivamente sulla base delle informazioni visive contenute nel video. Non possiedono la capacità di analizzare o comprendere i componenti audio presenti nel video.
Causalità temporale: il modello ha una comprensione limitata della causalità degli eventi nella progressione del video. Sebbene risponda bene a domande puntuali, non funziona altrettanto bene su risposte che dipendono dalla comprensione di una sequenza di eventi
Comprensione multilingue delle immagini: i modelli hanno una comprensione limitata delle immagini e dei fotogrammi video multilingue. Potrebbero avere difficoltà o avere allucinazioni durante compiti simili.
Identificazione delle persone: i modelli Amazon Nova non supportano la capacità di identificare o nominare persone in immagini, documenti o video. I modelli si rifiuteranno di eseguire tali attività.
Ragionamento spaziale: i modelli Amazon Nova hanno capacità di ragionamento spaziale limitate. Possono avere difficoltà a svolgere attività che richiedono una localizzazione precisa o un'analisi del layout.
Testo di piccole dimensioni nelle immagini o nei video: se il testo dell'immagine o del video è troppo piccolo, valuta la possibilità di aumentare le dimensioni relative del testo nell'immagine ritagliandolo fino alla sezione pertinente e preservando il contenuto necessario.
Conteggio: i modelli Amazon Nova possono fornire conteggi approssimativi degli oggetti in un'immagine, ma potrebbero non essere sempre precisi, specialmente quando si tratta di un gran numero di oggetti di piccole dimensioni.
Contenuti inappropriati: i modelli Amazon Nova non elaboreranno immagini inappropriate o esplicite che violano la Politica di utilizzo accettabile
Applicazioni sanitarie: a causa della natura sensibile di questi artefatti, anche se i modelli Amazon Nova possono fornire analisi generali su immagini o video sanitari, non è consigliabile interpretare scansioni diagnostiche complesse. La risposta di Amazon Nova non dovrebbe mai essere considerata un sostituto della consulenza medica professionale.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Comprensione video

Esempi di comprensione video