線形学習のハイパーパラメータ - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

線形学習のハイパーパラメータ

線形学習者アルゴリズムのハイパーパラメータを以下の表に示します。これらは、データからモデルパラメータを推定しやすくするためにユーザが設定するパラメータです。設定の必要がある必須ハイパーパラメータは、アルファベット順に最初に一覧表示されています。設定可能なオプションのハイパーパラメータは、アルファベット順に次に一覧表示されています。ハイパーパラメータがに設定されている場合auto、アマゾン SageMaker は、そのハイパーパラメータの値を自動的に計算して設定します。

Parameter Name 説明
num_classes

レスポンス変数のクラス数。このアルゴリズムでは、クラスに 0, ..., num_classes - 1 のラベルが付けられていると想定します。

predictor_typemulticlass_classifier の場合、必須です。それ以外の場合、アルゴリズムはこれを無視します。

有効な値: 3 ~ 1,000,000 の整数

predictor_type

ターゲット変数のタイプを、二項分類、複数クラス分類、または回帰として指定します。

[Required] (必須)

有効な値: binary_classifiermulticlass_classifier、または regressor

accuracy_top_k

複数クラス分類のトップ k 精度メトリクスを計算するときには、k の値。モデルがトップ k のスコアの 1 つを実際のラベルに割り当てる場合、サンプルは正しいものとしてスコア付けされます。

オプション

有効な値: 正の整数

デフォルト値: 3

balance_multiclass_weights

クラスの重みを使用するかどうかを指定します。これにより、損失関数で各クラスの重要度が等しくなります。predictor_typemulticlass_classifier である場合にのみ使用されます。

オプション

有効な値: truefalse

デフォルト値: false

beta_1

最初のモーメントの見積もりの指数関数的減衰率。optimizer の値が adam のである場合にのみ適用されます。

オプション

有効な値 : auto または 0 ~ 1.0 の浮動小数点値

デフォルト値: auto

beta_2

2 番目のモーメントの見積もりの指数関数的減衰率。optimizer の値が adam のである場合にのみ適用されます。

オプション

有効な値 : auto または 0 ~ 1.0 の浮動小数点整数

デフォルト値: auto

bias_lr_mult

バイアス項に別の学習レートを許可します。バイアスの実際の学習レートは learning_rate * bias_lr_mult です。

オプション

有効な値: auto または正の浮動小数点整数

デフォルト値: auto

bias_wd_mult

バイアス項に別の正規化を許可します。バイアスの L2 正規化の実際の重みは、wd * bias_wd_mult です。デフォルトでは、バイアス項に正規化はありません。

オプション

有効な値: auto または負でない浮動小数点整数

デフォルト値: auto

binary_classifier_model_selection_criteria

predictor_typebinary_classifier に設定されている場合は、検証データセット (または検証データセットを指定していない場合はトレーニングデータセット) のモデル評価基準。基準は次のとおりです。

  • accuracy - 最も精度の高いモデル。

  • f_beta - F1 スコアが最も高いモデル。デフォルトは F1 です。

  • precision_at_target_recall - 指定された再現率目標で最も適合率の高いモデル。

  • recall_at_target_precision - 指定された適合率目標で最も再現率の高いモデル。

  • loss_function - トレーニングで使用される損失関数の値が最も低いモデル。

オプション

有効な値: accuracyf_betaprecision_at_target_recallrecall_at_target_precision、または loss_function

デフォルト値: accuracy

early_stopping_patience 関連するメトリクスが改善されない場合にトレーニングを終了するまでに待機するエポックの数。binary_classifier_model_selection_criteria に値を指定した場合、メトリクスはその値になります。それ以外の場合、メトリクスは loss ハイパーパラメータに指定された値と同じになります。

メトリクスは検証データ上で評価されます。検証データを提供していない場合、メトリクスは常に loss ハイパーパラメータに指定された値と同じになり、トレーニングデータで評価されます。早期停止を無効にするには、early_stopping_patienceepochs に指定された値より大きい値に設定します。

オプション

有効な値: 正の整数

デフォルト値: 3

early_stopping_tolerance

損失の改善を計測する相対的な許容値。損失改善率から前の最善の損失を除算した値がこの値よりも小さい場合、早期停止は改善がゼロであると見なします。

オプション

有効な値: 正の浮動小数点整数

デフォルト値: 0.001

epochs

トレーニングデータへのパスの最大数。

オプション

有効な値: 正の整数

デフォルト値: 15

f_beta

二項分類または複数クラス分類の F スコアメトリクスを計算するときに使用するベータの値。binary_classifier_model_selection_criteria に指定された値が f_beta である場合にも使用されます。

オプション

有効な値: 正の浮動小数点整数

デフォルト値: 1.0

feature_dim

入力データ内の特徴の数。

オプション

有効な値: auto または正の整数

デフォルト値: auto

huber_delta

Huber 損失のパラメータ。トレーニングとメトリクスの評価中、デルタより小さいエラーについては L2 損失、デルタより大きいエラーについては L1 損失を計算します。

オプション

有効な値: 正の浮動小数点整数

デフォルト値: 1.0

init_bias

バイアス項の初期重み。

オプション

有効な値: 浮動小数点整数

デフォルト値: 0

init_method

モデルの重み付けに使用される初期分布関数を設定します。関数は以下のとおりです。

  • uniform - (-スケール、+スケール) 間で均一に分布する

  • normal - 平均が 0 でシグマを使用する正規分布

オプション

有効な値: uniform または normal

デフォルト値: uniform

init_scale

モデルの重みに対して初期の uniform 分布をスケーリングします。init_method ハイパーパラメータが uniform に設定されている場合にのみ適用されます。

オプション

有効な値: 正の浮動小数点整数

デフォルト値: 0.07

init_sigma

正規分布の初期標準偏差。init_method ハイパーパラメータが normal に設定されている場合にのみ適用されます。

オプション

有効な値: 正の浮動小数点整数

デフォルト値: 0.01

l1

L1 正則化パラメータ。L1 正則化を使用しないようにするには、値を 0 に設定します。

オプション

有効な値: auto または負以外の浮動小数点数

デフォルト値: auto

learning_rate

パラメータ更新のためにオプティマイザによって使用されるステップサイズ。

オプション

有効な値: auto または正の浮動小数点整数

デフォルト値: auto (選択されているオプティマイザによって値が異なる)。

loss

損失関数を指定します。

使用可能な損失関数とそのデフォルト値は、predictor_type の値によって異なります。

  • predictor_typeregressor に設定されている場合、使用可能なオプションは autosquared_lossabsolute_losseps_insensitive_squared_losseps_insensitive_absolute_lossquantile_loss、および huber_loss です。auto のデフォルト値は squared_loss です。

  • predictor_typebinary_classifier に設定されている場合、使用可能なオプションは autologistic、および hinge_loss です。auto のデフォルト値は logistic です。

  • predictor_typemulticlass_classifier に設定されている場合、使用可能なオプションは auto および softmax_loss です。auto のデフォルト値は softmax_loss です。

有効な値: autologisticsquared_lossabsolute_losshinge_losseps_insensitive_squared_losseps_insensitive_absolute_lossquantile_loss、または huber_loss

オプション

デフォルト値: auto

loss_insensitivity

イプシロンを区別しない損失タイプのパラメータ。トレーニングとメトリクスの評価中、この値より小さいエラーはゼロであると見なされます。

オプション

有効な値: 正の浮動小数点整数

デフォルト値: 0.01

lr_scheduler_factor

lr_scheduler_step ハイパーパラメータごとに、学習レートはこの数量減少します。use_lr_scheduler ハイパーパラメータが true に設定されている場合にのみ適用されます。

オプション

有効な値 : auto または 0 ~ 1 の正の浮動小数点整数

デフォルト値: auto

lr_scheduler_minimum_lr

学習レートは lr_scheduler_minimum_lr に設定された値より低い値まで減少することはありません。use_lr_scheduler ハイパーパラメータが true に設定されている場合にのみ適用されます。

オプション

有効な値: auto または正の浮動小数点整数

デフォルト値: auto

lr_scheduler_step

学習レートの減少の間のステップの数。use_lr_scheduler ハイパーパラメータが true に設定されている場合にのみ適用されます。

オプション

有効な値: auto または正の整数

デフォルト値: auto

margin

hinge_loss 関数のマージン。

オプション

有効な値: 正の浮動小数点整数

デフォルト値: 1.0

mini_batch_size

データイテレーターのミニバッチごとの観測数。

オプション

有効な値: 正の整数

デフォルト値: 1000

momentum

sgd オプティマイザのモーメンタム。

オプション

有効な値 : auto または 0 ~ 1.0 の浮動小数点整数

デフォルト値: auto

normalize_data

トレーニング前に特徴を正規化します。データ正規化では、0 の平均を持つように各特徴のデータをシフトし、単位標準偏差を持つようにスケーリングします。

オプション

有効な値: autotrue、または false

デフォルト値: true

normalize_label

ラベルを正規化します。ラベル正規化はゼロの平均を持つようにラベルをシフトし、単位標準偏差を持つようにスケーリングします。

デフォルト値 auto では、ラベルは回帰問題に対して正規化されますが、分類問題に対しては正規化されません。分類問題において normalize_label ハイパーパラメータを true に設定した場合、アルゴリズムはそれを無視します。

オプション

有効な値: autotrue、または false

デフォルト値: auto

num_calibration_samples

モデルのキャリブレーション (最適なしきい値を見つけるとき) のために使用する、検証データセットから取得した観測値の数。

オプション

有効な値: auto または正の整数

デフォルト値: auto

num_models

並列でトレーニングするモデルの数。デフォルトの auto では、アルゴリズムが並列でトレーニングするモデルの数を決定します。1 つのモデルは、指定されたトレーニングパラメータ (正規化、オプティマイザ、損失) に従ってトレーニングされ、その以外のモデルはクローズパラメータによってトレーニングされます。

オプション

有効な値: auto または正の整数

デフォルト値: auto

num_point_for_scaler

正規化の計算または項のバイアス解除に使用するデータポイントの数。

オプション

有効な値: 正の整数

デフォルト値: 10,000

optimizer

使用する最適化アルゴリズム。

オプション

有効な値:

  • auto - デフォルト値。

  • sgd - 確率的勾配降下法。

  • adam - アダプティブモーメンタム推定

  • rmsprop - 平方勾配の移動平均を使用して勾配を正規化する、勾配ベースの最適化手法。

デフォルト値: auto。 のデフォルト設定autoですadam

positive_example_weight_mult

二項分類子をトレーニングするときに正のサンプルに割り当てられる重み。負の例の重みは 1 で固定されます。負の例正の例を分類する際のエラーがトレーニング損失に等しい影響を与えるようにアルゴリズムに重みを選択させるには、balanced を指定します。アルゴリズムにパフォーマンスを最適化する重みを選択させるには、auto を指定します。

オプション

有効な値:balancedauto、または正の浮動小数点整数

デフォルト値: 1.0

quantile

分位損失の分位数。分位数 q については、モデルは true_label の値が確率 q の予測より大きくなるように予測を作成しようとします。

オプション

有効な値: 0 ~ 1 の浮動小数点整数

デフォルト値: 0.5

target_precision

目標適合率。binary_classifier_model_selection_criteriarecall_at_target_precision である場合、再現率は最大化される一方で、適合率はこの値で保持されます。

オプション

有効な値: 0 ~ 1.0 の浮動小数点整数

デフォルト値: 0.8

target_recall

目標再現率。binary_classifier_model_selection_criteriaprecision_at_target_recall である場合、適合率は最大化される一方で、再現率はこの値で保持されます。

オプション

有効な値: 0 ~ 1.0 の浮動小数点整数

デフォルト値: 0.8

unbias_data

平均が 0 になるように、トレーニング前に特徴のバイアスを解除します。デフォルトでは、use_bias ハイパーパラメータが true に設定されると、データのバイアスは解除されます。

オプション

有効な値: autotrue、または false

デフォルト値: auto

unbias_label

平均が 0 になるように、トレーニング前にラベルのバイアスを解除します。use_bias ハイパーパラメータが true に設定されている場合にのみ、回帰に適用されます。

オプション

有効な値: autotrue、または false

デフォルト値: auto

use_bias

モデルにバイアス項 (線形方程式の切片項) を含めるかどうかを指定します。

オプション

有効な値: true または false

デフォルト値: true

use_lr_scheduler

学習レートにスケジューラを使用するかどうか。スケジューラを使用するには、true を指定します。

オプション

有効な値: true または false

デフォルト値: true

wd

重み付け減衰パラメータ。L2 正則化パラメータとも呼ばれます。L2 正則化を使用しないようにするには、値を 0 に設定します。

オプション

有効な値: auto または負でない浮動小数点整数

デフォルト値: auto