オブジェクト検出の仕組み - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

オブジェクト検出の仕組み

オブジェクト検出アルゴリズムは、既知のオブジェクトカテゴリの集合から、イメージ内のオブジェクトのすべてのインスタンスを識別し、特定します。アルゴリズムはイメージを入力として受け取り、オブジェクトが属するカテゴリと、そのカテゴリに属する信頼性スコアを出力します。アルゴリズムはさらに、長方形の境界ボックスを使用してオブジェクトの位置とスケールを予測します。Amazon SageMaker オブジェクト検出は、分類タスク用に事前にトレーニングされた畳み込みニューラルネットワーク (CNN) を基本ネットワークとして使用するシングルショットマルチボックス検出器 (SSD) アルゴリズムを使用します。SSD は、中間レイヤーの出力を検出用の特徴として使用します。

VGGResNet などのさまざまな CNN が、イメージ分類タスクで優れたパフォーマンスを達成しています。Amazon SageMaker オブジェクト検出は、SSD の基本ネットワークとして VGG-16 と ResNet-50 の両方をサポートしています。アルゴリズムは完全トレーニングモードまたは転移学習モードでトレーニングできます。完全トレーニングモードでは、基本ネットワークはランダムな重みで初期化されてから、ユーザーデータでトレーニングされます。転移学習モードでは、基本ネットワークの重みは事前トレーニング済みモデルからロードされます。

オブジェクト検出アルゴリズムは、反転、再スケール、ジッターなどの標準データオーグメンテーションオペレーションをオンザフライで内部的に使用することにより、オーバーフィットの回避に役立ちます。