イメージ分類ハイパーパラメータ

ハイパーパラメータは、機械学習モデルが学習を開始する前に設定されるパラメータです。次のハイパーパラメータは、Amazon SageMaker AI の組み込みイメージ分類アルゴリズムでサポートされています。イメージ分類ハイパーパラメータの調整については、「イメージ分類モデルを調整する」を参照してください。

Parameter Name	説明
`num_classes`	出力クラスの数。このパラメータは、ネットワーク出力のディメンションを定義し、通常はデータセット内のクラス数に設定されます。マルチクラス分類に加えて、マルチラベル分類もサポートされています。拡張マニフェストファイルを使用したマルチラベル分類の操作方法の詳細については、「イメージ分類アルゴリズムの入出力インターフェイス」を参照してください。必須有効な値: 正の整数
`num_training_samples`	入力データセット内のトレーニング例の数。この値とトレーニングセット内のサンプル数が一致しない場合、`lr_scheduler_step` パラメータの動作は未定義になり、分散型トレーニングの精度に影響することがあります。必須有効な値: 正の整数
`augmentation_type`	データ補強タイプ。入力イメージは、次に示す複数の方法で補強できます。 `crop`: イメージをランダムにトリミングし、水平に反転させます `crop_color`: "トリミング" に加えて、[-36, 36]、[-50, 50]、および [-50, 50] の範囲の 3 つのランダム値がそれぞれ対応する色相、彩度、輝度チャネルに加算されます `crop_color_transform`: `crop_color` に加えて、回転、せん断、アスペクト比のバリエーションなどのランダムな変換がイメージに適用されます。最大回転角度は 10 度、最大せん断比は 0.1、最大アスペクト変化比は 0.25 です。オプション有効な値: `crop`、`crop_color`、または `crop_color_transform` デフォルト値: なし
`beta_1`	`adam` の beta1。つまり、最初のモーメントの見積もりの指数関数的減衰率です。オプション有効な値: 浮動小数点数。[0, 1] の範囲です。デフォルト値: 0.9
`beta_2`	`adam` の beta2。つまり、2 番目のモーメントの見積もりの指数関数的減衰率です。オプション有効な値: 浮動小数点数。[0, 1] の範囲です。デフォルト値: 0.999
`checkpoint_frequency`	モデルパラメータを保存する期間 (エポック数)。すべてのチェックポイントファイルは、最終的なモデルファイル「model.tar.gz」の一部として保存され、指定されたモデルの場所に S3 にアップロードされることに注意してください。これにより、トレーニング中に保存されたチェックポイントの数に比例してモデルファイルのサイズが大きくなります。オプション有効な値: `epochs` 以下の正の整数。デフォルト値: なし (検証精度が最も高いエポックにチェックポイントを保存します)
`early_stopping`	トレーニング中に早期停止ロジックを使用する場合は `True`。使用しない場合は `False`。オプション有効な値: `True` または `False` デフォルト値: `False`
`early_stopping_min_epochs`	早期停止ロジックを呼び出す前に実行する必要があるエポックの最小数。`early_stopping` = `True` の場合にのみ使用されます。オプション有効な値: 正の整数デフォルト値: 10
`early_stopping_patience`	関連メトリクスで改善が見られなかった場合にトレーニングを終了する前に待機するエポックの数。`early_stopping` = `True` の場合にのみ使用されます。オプション有効な値: 正の整数デフォルト値: 5
`early_stopping_tolerance`	精度検証メトリクスの改善を測定する相対的な許容値。精度の改善を前回の最高精度で除算した比率が `early_stopping_tolerance` 値セットより小さい場合、早期停止は改善がないと見なします。`early_stopping` = `True` の場合にのみ使用されます。オプション有効な値: 0 ≤ 浮動小数点数 ≤ 1 デフォルト値: 0.0
`epochs`	トレーニングエポックの数。オプション有効な値: 正の整数デフォルト値: 30
`eps`	`adam` と `rmsprop` のイプシロン。通常は、0 で除算されないように小さな値に設定されます。オプション有効な値: 浮動小数点数。[0, 1] の範囲です。デフォルト値: 1e-8
`gamma`	`rmsprop` のガンマ、二乗勾配の移動平均の減衰係数。オプション有効な値: 浮動小数点数。[0, 1] の範囲です。デフォルト値: 0.9
`image_shape`	入力イメージのディメンション。これはネットワークの入力レイヤーと同じサイズになります。フォーマットは "`num_channels`, 高さ, 幅" として定義されます。ネットワークが入力の多様なディメンションを処理できるため、イメージディメンションは任意の値を受け取ることができます。ただし、大きなイメージディメンションが使用されている場合はメモリの制約がある可能性があります。事前にトレーニングされたモデルでは、224 x 224 に固定されたイメージサイズのみを使用できます。イメージ分類の一般的なイメージディメンションは '3,224,224' です。これは ImageNet データセットに似ています。トレーニングの場合、任意の次元でいずれかの入力イメージがこのパラメータよりも小さいと、トレーニングは失敗します。イメージが大きい場合、このパラメータで指定されたクロップ領域を使用して、イメージの一部がクロップされます。ハイパーパラメータ `augmentation_type` が設定されている場合、ランダムクロップが行われ、それ以外の場合は、中央クロップが行われます。推論時に、入力イメージのサイズはトレーニング中に使用された `image_shape` に変更されます。縦横比は保持されず、イメージはクロップされません。オプション有効な値: 文字列デフォルト値: '3,224,224'
`kv_store`	分散型トレーニング中の重み更新同期モード。重み更新は、複数マシン間で同期的または非同期的に更新できます。同期更新は、一般には非同期更新よりも精度が高くなりますが、低速な可能性があります。詳細については、MXNet の分散型トレーニングを参照してください。このパラメータは、単一のマシントレーニングには適用されません。 `dist_sync`: 勾配はすべてのワーカーで各バッチの後に同期されます。`dist_sync` では、バッチサイズは各マシンで使用されるバッチサイズを意味します。したがって、n 台のマシンがあり、バッチサイズ b を使用する場合、`dist_sync` はバッチサイズ nb でローカルのように動作します。 `dist_async`: 非同期更新を実行します。重みはマシンから勾配を受け取るたびに更新され、重みの更新はアトミックです。ただし、その順序は保証されません。オプション* 有効な値: `dist_sync` または `dist_async` デフォルト値: なし
`learning_rate`	初期学習レート。オプション有効な値: 浮動小数点数。[0, 1] の範囲です。デフォルト値: 0.1
`lr_scheduler_factor`	`lr_scheduler_step` = `lr_new` * `lr_old` として定義される、`lr_scheduler_factor` パラメータと組み合わせて使用される学習レートを下げる率。オプション有効な値: 浮動小数点数。[0, 1] の範囲です。デフォルト値: 0.1
`lr_scheduler_step`	学習レートを下げるエポック。`lr_scheduler_factor` パラメータで説明しているように、学習レートはこれらのエポックで `lr_scheduler_factor` だけ下げられます。たとえば、値が "10, 20" に設定されている場合、学習レートは 10 番目のエポックの後に `lr_scheduler_factor` だけ下げられ、20 番目のエポックの後に再び `lr_scheduler_factor` だけ下げられます。エポックは "," で区切られます。オプション有効な値: 文字列デフォルト値: なし
`mini_batch_size`	トレーニングのバッチサイズ。単一マシンのマルチ GPU の設定では、各 GPU は `mini_batch_size`/num_gpu トレーニングサンプルを処理します。dist_sync モードの複数マシントレーニングでは、実際のバッチサイズは `mini_batch_size` * マシン数です。詳細については、MXNet のドキュメントを参照してください。オプション有効な値: 正の整数デフォルト値: 32
`momentum`	`sgd` と `nag` のモーメンタムであり、他のオプティマイザでは無視されます。オプション有効な値: 浮動小数点数。[0, 1] の範囲です。デフォルト値: 0.9
`multi_label`	各サンプルに複数のラベルを割り当てることができる複数ラベル分類に使用するフラグ。全クラスの平均精度が記録されます。オプション有効な値: 0 または 1 デフォルト値: 0
`num_layers`	ネットワークのレイヤー数。大きなイメージサイズ (たとえば、224x224 - ImageNet など) のデータでは、レイヤー数をセット [18、34、50、101、152、200] から選択することをお勧めします。小さなイメージサイズ (たとえば、28x28 - CIFAR など) のデータでは、レイヤー数をセット [20、32、44、56、110] から選択することをお勧めします。各セット内のレイヤー数は ResNet の論文に基づきます。転移学習では、レイヤー数は基本ネットワークのアーキテクチャを定義するため、セット [18、34、50、101、152、200] からのみ選択できます。オプション有効な値: [18, 34, 50, 101, 152, 200] または [20, 32, 44, 56, 110] 内の正の整数。デフォルト値: 152
`optimizer`	オプティマイザのタイプ。オプティマイザのパラメータの詳細については、MXNet の API を参照してください。オプション有効な値: `sgd`、`adam`、`rmsprop`、`nag` のいずれか。 `sgd`: 確率的勾配降下法 `adam`: アダプティブモーメンタム推定 `rmsprop`: 二乗平均平方根の伝搬 `nag`: ネステロフ加速勾配デフォルト値: `sgd`
`precision_dtype`	トレーニングに使用される重みの精度。アルゴリズムは、重みに単精度 (`float32`) または半精度 (`float16`) を使用できます。重みに半精度を使用すると、メモリ消費量が減少します。オプション有効な値: `float32` または `float16` デフォルト値: `float32`
`resize`	トレーニングのためにイメージのサイズを変更した後、イメージの最短辺にあるピクセル数です。パラメータが設定されていない場合、トレーニングデータはサイズ変更なしで使用されます。パラメータは、トレーニングの失敗を防ぐため、`image_shape` の幅と高さのコンポーネントよりも大きくする必要があります。イメージコンテンツタイプを使用する場合は必須 RecordIO コンテンツタイプを使用する場合はオプション有効な値: 正の整数デフォルト値: なし
`top_k`	トレーニング中に top-k 精度を報告します。top-1 トレーニング精度はすでに報告されている通常のトレーニング精度と同じであるため、このパラメータは 1 より大きい必要があります。オプション有効な値: 1 より大きい正の整数。デフォルト値: なし
`use_pretrained_model`	トレーニングに事前トレーニング済みモデルを使用するためのフラグ。1 に設定すると、対応するレイヤー数の事前トレーニング済みモデルがロードされ、トレーニングに使用されます。最上位 FC レイヤーのみがランダムな重みで再初期化されます。それ以外の場合、ネットワークはゼロからトレーニングされます。オプション有効な値: 0 または 1 デフォルト値: 0
`use_weighted_loss`	重みがクラスの分布に基づいて計算される、複数ラベル分類に重み付き交差エントロピー損失を使用するためのフラグ (`multi_label` = 1 の場合にのみ使用)。オプション有効な値: 0 または 1 デフォルト値: 0
`weight_decay`	`sgd` と `nag` の係数重み減衰であり、他のオプティマイザでは無視されます。オプション有効な値: 浮動小数点数。[0, 1] の範囲です。デフォルト値: 0.0001

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

仕組み

モデルの調整