オブジェクト検出の仕組み - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

オブジェクト検出の仕組み

オブジェクト検出アルゴリズムは、既知のオブジェクトカテゴリの集合から、イメージ内のオブジェクトのすべてのインスタンスを識別し、特定します。アルゴリズムはイメージを入力として受け取り、オブジェクトが属するカテゴリと、そのカテゴリに属する信頼性スコアを出力します。アルゴリズムはさらに、長方形の境界ボックスを使用してオブジェクトの位置とスケールを予測します。Amazon SageMaker Object Detection は、分類タスク用に事前にトレーニングされた畳み込みニューラルネットワーク (CNN) をベースネットワークとするシングルショットマルチボックス検出器 (SSD) アルゴリズムを使用しています。SSD は、中間レイヤーの出力を検出用の特徴として使用します。

VGGなどのさまざまなCNNはResNet、画像分類タスクで優れたパフォーマンスを実現しています。Amazon のオブジェクト検出は SSD のベースネットワークとして VGG-16 と ResNet -50 SageMaker の両方をサポートしています。アルゴリズムは完全トレーニングモードまたは転移学習モードでトレーニングできます。完全トレーニングモードでは、基本ネットワークはランダムな重みで初期化されてから、ユーザーデータでトレーニングされます。転移学習モードでは、基本ネットワークの重みは事前トレーニング済みモデルからロードされます。

オブジェクト検出アルゴリズムは、反転、再スケール、ジッターなどの標準データオーグメンテーションオペレーションをオンザフライで内部的に使用することにより、オーバーフィットの回避に役立ちます。