Limitações de compreensão de vídeo - Amazon Nova

Limitações de compreensão de vídeo

Confira abaixo as principais limitações do modelo, em que a precisão e a performance do modelo podem não ser garantidos.

  • Um vídeo por solicitação: atualmente, o modelo suporta apenas um vídeo por solicitação. Alguns frameworks e bibliotecas usam memória para acompanhar as interações anteriores. Pode haver um vídeo que tenha sido adicionado em um contexto anterior.

  • Sem suporte de áudio: atualmente, os modelos são treinados para processar e entender o conteúdo de vídeo exclusivamente com base nas informações visuais do vídeo. Eles não têm a capacidade de analisar ou compreender nenhum componente de áudio presente no vídeo.

  • Causalidade temporal: o modelo tem uma compreensão limitada da causalidade de eventos na progressão do vídeo. Embora responda bem a perguntas pontuais, ele não funciona tão bem em respostas que dependem da compreensão de uma sequência de eventos.

  • Compreensão multilíngue de imagens: os modelos têm uma compreensão limitada de imagens e quadros de vídeo multilíngues. Eles podem ter dificuldades ou apresentar alucinações em tarefas semelhantes.

  • Identificação de pessoas: os modelos do Amazon Nova não são compatíveis com a capacidade de identificar ou nomear indivíduos em imagens, documentos ou vídeos. Os modelos se recusarão a realizar tais tarefas.

  • Raciocínio espacial: os modelos do Amazon Nova têm capacidades limitadas de raciocínio espacial. Eles podem ter dificuldades com tarefas que exijam localização precisa ou análise de layout.

  • Texto pequeno em imagens ou vídeos: se o texto na imagem ou no vídeo for muito pequeno, considere aumentar o tamanho relativo do texto na imagem recortando a seção relevante e preservando o conteúdo necessário.

  • Contagem: os modelos do Amazon Nova podem fornecer contagens aproximadas de objetos em uma imagem, mas podem nem sempre ser precisamente exatos, especialmente ao lidar com um grande número de objetos pequenos.

  • Conteúdo impróprio: os modelos do Amazon Nova não processarão imagens impróprias ou explícitas que violem a Política de Uso Aceitável.

  • Aplicações de saúde: devido à natureza sensível desses artefatos, embora os modelos do Amazon Nova possam fornecer análises gerais sobre imagens ou vídeos de saúde, não recomendamos que você interprete exames diagnósticos complexos. A resposta do Amazon Nova nunca deve ser considerada um substituto para aconselhamento médico profissional.