影片理解限制 - Amazon Nova

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

影片理解限制

以下是關鍵模型限制,其中可能無法保證模型準確性和效能。

  • 每個請求一個視訊:目前模型每個請求僅支援 1 個視訊。有些架構和程式庫使用記憶體來追蹤先前的互動。上一個內容中可能會新增影片。

  • 無音訊支援:模型目前經過訓練,僅根據影片中的視覺資訊來處理和了解影片內容。它們不具備分析或理解視訊中存在的任何音訊元件的能力。

  • 時間因果關係:模型在影片進展期間對事件因果關係的了解有限。雖然它很適合指向時間問題,但它在依賴於了解一系列事件的答案上表現不佳

  • 多語言影像理解:模型對多語言影像和影片影格的理解有限。他們可能會在類似的任務上遇到困難或幻覺。

  • 人員識別:Amazon Nova 模型不支援在影像、文件或影片中識別或命名個人的能力。這些模型會拒絕執行這類任務。

  • 空間推理:Amazon Nova 模型的空間推理功能有限。他們可能難以處理需要精確當地語系化或配置分析的任務。

  • 影像或影片中的小型文字:如果影像或影片中的文字太小,請考慮在保留必要內容的同時裁切至相關區段,以增加影像中文字的相對大小。

  • 計數:Amazon Nova 模型可以提供影像中物件的近似計數,但不一定總是精確的,尤其是在處理大量小型物件時。

  • 不適當的內容:Amazon Nova 模型不會處理違反可接受的使用政策的不適當或明確的映像

  • 醫療保健應用程式:由於這些成品的敏感性質,即使 Amazon Nova 模型可以對醫療保健影像或影片進行一般分析,我們不建議您解釋複雜的診斷掃描。Amazon Nova 的回應不應被視為替代專業醫療建議。