イメージ分類の仕組み - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

イメージ分類の仕組み

イメージ分類アルゴリズムでは、イメージを入力として受け取り、それを出力カテゴリの 1 つに分類します。ディープラーニングはイメージ分類ドメインに革命をもたらし、優れたパフォーマンスを実現しました。次のようなさまざまなディープラーニングネットワーク ResNet[1]、 DenseNet、inception などは、イメージ分類の精度を高めるために開発されています。同時に、これらのネットワークのトレーニングに不可欠なラベル付きのイメージデータを収集する作業が行われてきました。 ImageNet[2] はこのような大規模データセットの 1 つで、約 11,000 個のカテゴリを持つ 1,100 万を超えるイメージがあります。ネットワークがトレーニングされると ImageNet データは、簡単な再調整や微調整を加えるだけで、他のデータセットでも汎用化できます。この転移学習アプローチでは、ネットワークは重み (この例では ImageNet)。これは後で別のデータセットのイメージ分類タスク用に微調整できます。

Amazon でのイメージ分類 SageMaker 完全トレーニングと転移学習の 2 つのモードで実行できます。完全トレーニングモードでは、ネットワークはランダムな重みで初期化され、ユーザーデータでゼロからトレーニングされます。転送学習モードでは、ネットワークは事前にトレーニングされた重みで初期化され、最上位の完全に接続されたレイヤーだけがランダムな重みで初期化されます。次に、ネットワーク全体が新しいデータで微調整されます。このモードでは、小規模なデータセットでもトレーニングを実現できます。これは、ネットワークがすでにトレーニングされているため、十分なトレーニングデータがない場合でも使用できるからです。