画像理解の制限 - Amazon Nova

画像理解の制限

Amazon Nova の次の制限事項について説明します。

  • 多言語画像理解: モデルは多言語画像および動画フレームに対する理解が限られており、同様のタスクで苦戦したりハルシネーションしたりする可能性があります。

  • 人物識別: Amazon Nova モデルでは、画像、ドキュメント、動画に含まれる個人を識別または名前を付ける機能がサポートされていません。モデルはそのようなタスクの実行を拒否します。

  • 空間推論: Amazon Nova モデルには、空間推論機能が限られています。正確な位置特定やレイアウト分析を必要とするタスクに手こずる可能性があります。

  • 画像/動画内の小さなテキスト: 画像または動画のテキストが小さすぎる場合、必要なコンテキストを維持しながら関連するセクションにトリミングして、画像内のテキストの相対サイズを増やすことを検討してください。

  • カウント: Amazon Nova モデルは、画像内のオブジェクトの概算数を提示できますが、特に多数の小さなオブジェクトを扱う場合、常に正確とは限りません。

  • 不適切なコンテンツ: Amazon Nova モデルは、適正利用規約に違反する不適切または露骨な画像を処理しません。

  • ヘルスケア用途: これらのアーティファクトは機密性が高いため、Amazon Nova モデルはヘルスケアの画像や動画の一般的な分析を行うことができますが、複雑な診断スキャンを解釈することはお勧めしません。Amazon Nova のレスポンスは、専門家による医療アドバイスに代わるものとして扱ってはなりません。