Limiti relativi alla comprensione dei video - Amazon Nova

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Limiti relativi alla comprensione dei video

Di seguito sono riportate le principali limitazioni del modello, in cui la precisione e le prestazioni del modello potrebbero non essere garantite.

  • Un video per richiesta: attualmente il modello supporta solo 1 video per richiesta. Alcuni framework e librerie utilizzano la memoria per tenere traccia delle interazioni precedenti. Potrebbe esserci un video che è stato aggiunto in un contesto precedente.

  • Nessun supporto audio: i modelli sono attualmente addestrati a elaborare e comprendere i contenuti video esclusivamente sulla base delle informazioni visive contenute nel video. Non possiedono la capacità di analizzare o comprendere i componenti audio presenti nel video.

  • Causalità temporale: il modello ha una comprensione limitata della causalità degli eventi nella progressione del video. Sebbene risponda bene a domande puntuali, non funziona altrettanto bene su risposte che dipendono dalla comprensione di una sequenza di eventi

  • Comprensione multilingue delle immagini: i modelli hanno una comprensione limitata delle immagini e dei fotogrammi video multilingue. Potrebbero avere difficoltà o avere allucinazioni durante compiti simili.

  • Identificazione delle persone: i modelli Amazon Nova non supportano la capacità di identificare o nominare persone in immagini, documenti o video. I modelli si rifiuteranno di eseguire tali attività.

  • Ragionamento spaziale: i modelli Amazon Nova hanno capacità di ragionamento spaziale limitate. Possono avere difficoltà a svolgere attività che richiedono una localizzazione precisa o un'analisi del layout.

  • Testo di piccole dimensioni nelle immagini o nei video: se il testo dell'immagine o del video è troppo piccolo, valuta la possibilità di aumentare le dimensioni relative del testo nell'immagine ritagliandolo fino alla sezione pertinente e preservando il contenuto necessario.

  • Conteggio: i modelli Amazon Nova possono fornire conteggi approssimativi degli oggetti in un'immagine, ma potrebbero non essere sempre precisi, specialmente quando si tratta di un gran numero di oggetti di piccole dimensioni.

  • Contenuti inappropriati: i modelli Amazon Nova non elaboreranno immagini inappropriate o esplicite che violano la Politica di utilizzo accettabile

  • Applicazioni sanitarie: a causa della natura sensibile di questi artefatti, anche se i modelli Amazon Nova possono fornire analisi generali su immagini o video sanitari, non è consigliabile interpretare scansioni diagnostiche complesse. La risposta di Amazon Nova non dovrebbe mai essere considerata un sostituto della consulenza medica professionale.