Limitações de compreensão de vídeo
Confira abaixo as principais limitações do modelo, em que a precisão e a performance do modelo podem não ser garantidos.
-
Um vídeo por solicitação: atualmente, o modelo suporta apenas um vídeo por solicitação. Alguns frameworks e bibliotecas usam memória para acompanhar as interações anteriores. Pode haver um vídeo que tenha sido adicionado em um contexto anterior.
-
Sem suporte de áudio: atualmente, os modelos são treinados para processar e entender o conteúdo de vídeo exclusivamente com base nas informações visuais do vídeo. Eles não têm a capacidade de analisar ou compreender nenhum componente de áudio presente no vídeo.
-
Causalidade temporal: o modelo tem uma compreensão limitada da causalidade de eventos na progressão do vídeo. Embora responda bem a perguntas pontuais, ele não funciona tão bem em respostas que dependem da compreensão de uma sequência de eventos.
-
Compreensão multilíngue de imagens: os modelos têm uma compreensão limitada de imagens e quadros de vídeo multilíngues. Eles podem ter dificuldades ou apresentar alucinações em tarefas semelhantes.
-
Identificação de pessoas: os modelos do Amazon Nova não são compatíveis com a capacidade de identificar ou nomear indivíduos em imagens, documentos ou vídeos. Os modelos se recusarão a realizar tais tarefas.
-
Raciocínio espacial: os modelos do Amazon Nova têm capacidades limitadas de raciocínio espacial. Eles podem ter dificuldades com tarefas que exijam localização precisa ou análise de layout.
-
Texto pequeno em imagens ou vídeos: se o texto na imagem ou no vídeo for muito pequeno, considere aumentar o tamanho relativo do texto na imagem recortando a seção relevante e preservando o conteúdo necessário.
-
Contagem: os modelos do Amazon Nova podem fornecer contagens aproximadas de objetos em uma imagem, mas podem nem sempre ser precisamente exatos, especialmente ao lidar com um grande número de objetos pequenos.
-
Conteúdo impróprio: os modelos do Amazon Nova não processarão imagens impróprias ou explícitas que violem a Política de Uso Aceitável.
-
Aplicações de saúde: devido à natureza sensível desses artefatos, embora os modelos do Amazon Nova possam fornecer análises gerais sobre imagens ou vídeos de saúde, não recomendamos que você interprete exames diagnósticos complexos. A resposta do Amazon Nova nunca deve ser considerada um substituto para aconselhamento médico profissional.