線形学習モデルを調整する

自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、データセットのさまざまなハイパーパラメータをテストする多数のジョブを実行して、モデルの最適なバージョンを見つけます。調整可能なハイパーパラメータ、それぞれの値の範囲、および目標メトリクスを選択します。アルゴリズムが計算するメトリクスから目標メトリクスを選択します。自動モデル調整は、選択されたハイパーパラメータを検索して、目標メトリクスを最適化するモデルになる値の組み合わせを見つけます。

線形学習者アルゴリズムには、ここで説明する自動モデル調整機能とは別に、ハイパーパラメータを調整するための内部メカニズムもあります。デフォルトでは、線形学習者アルゴリズムは複数のモデルを並行してトレーニングすることによってハイパーパラメータを調整します。自動モデル調整を使用すると、線形学習者の内部調整メカニズムは自動的にオフになります。これにより、並列モデルの数 num_models が 1 に設定されます。num_models に設定した値は、アルゴリズムによって無視されます。

モデル調整の詳細については、「SageMaker AI による自動モデル調整」を参照してください。

線形学習アルゴリズムによって計算されたメトリクス

線形学習者アルゴリズムは、次のテーブルのメトリクスをレポートします。このメトリクスは、トレーニング中に計算されます。それらの 1 つを目標メトリクスとして選択してください。過剰適合を回避するために、トレーニングメトリクスではなく検証メトリクスに対してモデルを調整することをお勧めします。

メトリクス名	説明	最適化の方向
`test:absolute_loss`	テストデータセットの最終モデルの絶対損失。この目標メトリクスは、回帰にのみ有効です。	最小化
`test:binary_classification_accuracy`	テストデータセットの最終モデルの精度。この目標メトリクスは、二項分類にのみ有効です。	最大化
`test:binary_f_beta`	テストデータセットの最終モデルの F-ベータスコア。デフォルトでは、これは F1 スコアであり、適合率と再現率の調和平均です。この目標メトリクスは、二項分類にのみ有効です。	最大化
`test:dcg`	テストデータセットの最終モデルの減損累積利得。この目標メトリクスは、複数クラス分類にのみ有効です。	最大化
`test:macro_f_beta`	テストデータセットの最終モデルの F-ベータスコア。この目標メトリクスは、複数クラス分類にのみ有効です。	最大化
`test:macro_precision`	テストデータセットの最終モデルの適合スコア。この目標メトリクスは、複数クラス分類にのみ有効です。	最大化
`test:macro_recall`	テストデータセットの最終モデルの再現率スコア。この目標メトリクスは、複数クラス分類にのみ有効です。	最大化
`test:mse`	テストデータセットの最終モデルの平均二乗誤差。この目標メトリクスは、回帰にのみ有効です。	最小化
`test:multiclass_accuracy`	テストデータセットの最終モデルの精度。この目標メトリクスは、複数クラス分類にのみ有効です。	最大化
`test:multiclass_top_k_accuracy`	テストデータセットで予測された上位 k のラベルの精度。このメトリクスを目標として選択する場合は、`accuracy_top_k` ハイパーパラメータを使用して k の値を設定することをおすすめします。この目標メトリクスは、複数クラス分類にのみ有効です。	最大化
`test:objective_loss`	モデルがトレーニングされた後のテストデータセットの目標損失関数の平均値。既定の設定では、損失は、二項分類ではロジスティック損失、回帰では二乗損失です。他のタイプの損失を設定するには、 `loss` ハイパーパラメータを使用します。	最小化
`test:precision`	テストデータセットの最終モデルの適合率。このメトリクスを目標として選択した場合は、`binary_classifier_model_selection` ハイパーパラメータを `precision_at_target_recall` に設定し、`target_recall` ハイパーパラメータの値を設定して、目標再現率を設定することをお勧めします。この目標メトリクスは、二項分類にのみ有効です。	最大化
`test:recall`	テストデータセットの最終モデルの再現率。このメトリクスを目標として選択した場合は、`binary_classifier_model_selection` ハイパーパラメータを `recall_at_target_precision` に設定し、`target_precision` ハイパーパラメータの値を設定して、目標適合率を設定することをお勧めします。この目標メトリクスは、二項分類にのみ有効です。	最大化
`test:roc_auc_score`	テストデータセットにおける最終モデルの受信操作特性曲線 (ROC 曲線) の下面積。この目標メトリクスは、二項分類にのみ有効です。	最大化
`validation:absolute_loss`	検証データセットの最終モデルの絶対損失。この目標メトリクスは、回帰にのみ有効です。	最小化
`validation:binary_classification_accuracy`	検証データセットの最終モデルの精度。この目標メトリクスは、二項分類にのみ有効です。	最大化
`validation:binary_f_beta`	検証データセットの最終モデルの F-ベータスコア。デフォルトでは、F-ベータスコアは F1 スコアであり、`validation:precision` および `validation:recall` メトリクスの調和平均です。この目標メトリクスは、二項分類にのみ有効です。	最大化
`validation:dcg`	検証データセットにおける最終モデルの減損累積利得。この目標メトリクスは、複数クラス分類にのみ有効です。	最大化
`validation:macro_f_beta`	検証データセットの最終モデルの F-ベータスコア。この目標メトリクスは、複数クラス分類にのみ有効です。	最大化
`validation:macro_precision`	検証データセットの最終モデルの適合スコア。この目標メトリクスは、複数クラス分類にのみ有効です。	最大化
`validation:macro_recall`	検証データセットの最終モデルの再現率スコア。この目標メトリクスは、複数クラス分類にのみ有効です。	最大化
`validation:mse`	検証データセットの最終モデルの平均二乗誤差。この目標メトリクスは、回帰にのみ有効です。	最小化
`validation:multiclass_accuracy`	検証データセットの最終モデルの精度。この目標メトリクスは、複数クラス分類にのみ有効です。	最大化
`validation:multiclass_top_k_accuracy`	検証データセットで予測された上位 k 個のラベルの精度。このメトリクスを目的として選択する場合は、`accuracy_top_k` ハイパーパラメータを使用して k の値を設定することをおすすめします。この目標メトリクスは、複数クラス分類にのみ有効です。	最大化
`validation:objective_loss`	各エポックにおける検証データセットに対する目標損失関数の平均値。既定の設定では、損失は、二項分類ではロジスティック損失、回帰では二乗損失です。他のタイプの損失を設定するには、`loss` ハイパーパラメータを使用します。	最小化
`validation:precision`	検証データセットの最終モデルの精度。このメトリクスを目標として選択した場合は、`binary_classifier_model_selection` ハイパーパラメータを `precision_at_target_recall` に設定し、`target_recall` ハイパーパラメータの値を設定して、目標再現率を設定することをお勧めします。この目標メトリクスは、二項分類にのみ有効です。	最大化
`validation:recall`	検証データセットの最終モデルのリコール。このメトリクスを目標として選択した場合は、`binary_classifier_model_selection` ハイパーパラメータを `recall_at_target_precision` に設定し、`target_precision` ハイパーパラメータの値を設定して、目標適合率を設定することをお勧めします。この目標メトリクスは、二項分類にのみ有効です。	最大化
`validation:rmse`	検証データセットの最終モデルの二乗平均平方根誤差。この目標メトリクスは、回帰にのみ有効です。	最小化
`validation:roc_auc_score`	検証データセットにおける最終モデルの受信操作特性曲線 (ROC 曲線) の下面積。この目標メトリクスは、二項分類にのみ有効です。	最大化

線形学習ハイパーパラメータの調整

以下のハイパーパラメータを使用して線形学習者モデルを調整できます。

パラメータ名	パラメータタイプ	推奨範囲
`wd`	`ContinuousParameterRanges`	`MinValue:` `1e-7`, `MaxValue`: `1`
`l1`	`ContinuousParameterRanges`	`MinValue`: `1e-7`, `MaxValue`: `1`
`learning_rate`	`ContinuousParameterRanges`	`MinValue`: `1e-5`, `MaxValue`: `1`
`mini_batch_size`	`IntegerParameterRanges`	`MinValue`: `100`, `MaxValue`: `5000`
`use_bias`	`CategoricalParameterRanges`	`[True, False]`
`positive_example_weight_mult`	`ContinuousParameterRanges`	`MinValue`: 1e-5、`MaxValue`: `1e5`

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

ハイパーパラメータ

推論の形式