イメージ分類の仕組み - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

イメージ分類の仕組み

イメージ分類アルゴリズムでは、イメージを入力として受け取り、それを出力カテゴリの 1 つに分類します。ディープラーニングはイメージ分類ドメインに革命をもたらし、優れたパフォーマンスを実現しました。など、さまざまなディープラーニングネットワークResNetDenseNetインセプションなどは、画像分類の精度を高めるために開発されました。同時に、これらのネットワークのトレーニングに不可欠なラベル付きのイメージデータを収集する作業が行われてきました。ImageNetは、約11,000のカテゴリの1,100万枚を超える画像を含む非常に大きなデータセットの1つです。ネットワークがトレーニングされたらImageNetデータは、簡単な再調整や微調整を行うことで、他のデータセットとのジェネラライズにも使用できます。この転移学習アプローチでは、ネットワークを重みで初期化します (この例では、次の方法で学習しています)。ImageNet) は、後で別のデータセットの画像分類タスク用に微調整できます。

アマゾンの画像分類SageMakerフルトレーニングと転移学習の2つのモードで実行できます。完全トレーニングモードでは、ネットワークはランダムな重みで初期化され、ユーザーデータでゼロからトレーニングされます。転送学習モードでは、ネットワークは事前にトレーニングされた重みで初期化され、最上位の完全に接続されたレイヤーだけがランダムな重みで初期化されます。次に、ネットワーク全体が新しいデータで微調整されます。このモードでは、小規模なデータセットでもトレーニングを実現できます。これは、ネットワークがすでにトレーニングされているため、十分なトレーニングデータがない場合でも使用できるからです。