비디오 이해 제한 사항
다음은 모델 정확도와 성능이 보장되지 않을 수 있는 주요 모델 제한 사항입니다.
-
요청당 비디오 1개: 현재 모델은 요청당 비디오 1개만 지원합니다. 일부 프레임워크 및 라이브러리는 메모리를 사용하여 이전 상호 작용을 추적합니다. 이전 컨텍스트에 추가된 비디오가 있을 수 있습니다.
-
오디오 지원 없음: 모델은 현재 비디오의 시각적 정보만을 기반으로 비디오 콘텐츠를 처리하고 이해하도록 훈련되어 있습니다. 비디오에 있는 오디오 구성 요소를 분석하거나 이해할 수 있는 기능은 없습니다.
-
시간적 인과 관계: 모델은 비디오 진행 과정에서 이벤트 인과 관계에 대한 이해가 제한적입니다. 특정 시점을 가리키는 질문에는 잘 답변하지만 일련의 이벤트를 이해하는 데 의존하는 답변에는 잘 작동하지 않습니다.
-
다국어 이미지 이해: 모델은 다국어 이미지와 비디오 프레임에 대한 이해가 제한적입니다. 유사한 태스크에서 어려움을 겪거나 할루시네이션이 발생할 수 있습니다.
-
사람 식별: Amazon Nova 모델은 이미지, 문서 또는 비디오에서 개인을 식별하거나 이름을 지정하는 기능을 지원하지 않습니다. 모델은 이러한 태스크 수행을 거부합니다.
-
공간 추론: Amazon Nova 모델은 공간 추론 기능이 제한적입니다. 따라서 정밀한 현지화 또는 레이아웃 분석이 필요한 태스크에서 어려움을 겪을 수 있습니다.
-
이미지 또는 비디오의 작은 텍스트: 이미지 또는 비디오의 텍스트가 너무 작은 경우, 필요한 컨텍스트를 유지하면서 관련 섹션으로 잘라내어 이미지의 텍스트 상대 크기를 늘리는 것을 고려하세요.
-
수 계산: Amazon Nova 모델은 이미지 내 객체의 대략적인 개수를 제공할 수 있지만, 특히 작은 개체가 많은 경우 정확하지 않을 수 있습니다.
-
부적절한 콘텐츠: Amazon Nova 모델은 이용 정책을 위반하는 부적절하거나 노골적인 이미지는 처리하지 않습니다.
-
의료 애플리케이션: 이러한 아티팩트의 민감한 특성으로 인해 Amazon Nova 모델은 의료 이미지 또는 비디오에 대한 일반적인 분석을 제공할 수 있지만, 복잡한 진단 스캔을 해석하는 것은 권장하지 않습니다. Amazon Nova의 응답은 전문적인 의학적 조언을 대체하는 것으로 간주해서는 안 됩니다.