イメージ分類の仕組み - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

イメージ分類の仕組み

イメージ分類アルゴリズムでは、イメージを入力として受け取り、それを出力カテゴリの 1 つに分類します。ディープラーニングはイメージ分類ドメインに革命をもたらし、優れたパフォーマンスを実現しました。次のようなさまざまなディープラーニングネットワーク ResNet[1]、 DenseNet、inceptionなどは、画像分類の精度を高めるために開発されました。同時に、これらのネットワークのトレーニングに不可欠なラベル付き画像データを収集する取り組みも行われています。 ImageNet[2] は、約11,000のカテゴリを含む1,100万を超える画像を含むそのような大規模なデータセットの1つです。ネットワークがトレーニングされたら ImageNet データは、簡単な再調整や微調整により、他のデータセットとの一般化にも使用できます。この転移学習アプローチでは、ネットワークは重みで初期化されます (この例では ImageNet)は、後で別のデータセットの画像分類タスクに合わせて微調整できます。

Amazon でのイメージ分類 SageMaker は、完全トレーニングと転移学習の 2 つのモードで実行できます。完全トレーニングモードでは、ネットワークはランダムな重みで初期化され、ユーザーデータでゼロからトレーニングされます。転送学習モードでは、ネットワークは事前にトレーニングされた重みで初期化され、最上位の完全に接続されたレイヤーだけがランダムな重みで初期化されます。次に、ネットワーク全体が新しいデータで微調整されます。このモードでは、小規模なデータセットでもトレーニングを実現できます。これは、ネットワークがすでにトレーニングされているため、十分なトレーニングデータがない場合でも使用できるからです。