本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
調校線性學習程式模型
自動模型調校,又稱為超參數調校,會透過在您的資料集上,執行許多測試超參數範圍的任務,來尋找最佳版本的模型。您可以選擇可調校的超參數、每一個超參數的值範圍,及目標指標。您可以從演算法運算的指標中選擇目標指標。自動模型調校會搜尋所選擇的超參數,以找出產生之模型可最佳化目標指標的值組合。
線性學習程式演算法也有內部機制可調校超參數,與此處描述的自動模型調校功能有所區隔。根據預設,線性學習程式演算法會透過平行訓練多個模型來調校超參數。當您使用自動模型調校時,線性學習程式的內部調校機制會自動關閉。這會將平行模型的數量 num_models
設為 1。演算法會忽略您針對 num_models
設定的任何值。
如需模型調校的詳細資訊,請參閱使用 SageMaker AI 自動調校模型。
依線性學習程式演算法運算的指標
線性學習程式演算法回報下表中的指標,它們是在訓練期間計算的。選擇其中一個做為目標指標。為了避免過度擬合,建議您針對驗證指標調校模型,不是針對訓練指標。
指標名稱 | 描述 | 最佳化方向 |
---|---|---|
test:absolute_loss |
測試資料集之最終模型的絕對損失。此目標指標僅對迴歸有效。 |
最小化 |
test:binary_classification_accuracy |
測試資料集之最終模型的準確性。此目標指標僅對二元分類有效。 |
最大化 |
test:binary_f_beta |
測試資料集之最終模型的 F-beta 分數。根據預設是 F1 分數,這是精確度和回呼的調和平均數。此目標指標僅對二元分類有效。 |
最大化 |
test:dcg |
測試資料集之最終模型的折扣累積增益。此目標指標僅對多類別分類有效。 |
最大化 |
test:macro_f_beta |
測試資料集之最終模型的 F-beta 分數。此目標指標僅對多類別分類有效。 |
最大化 |
test:macro_precision |
測試資料集之最終模型的精確度分數。此目標指標僅對多類別分類有效。 |
最大化 |
test:macro_recall |
測試資料集之最終模型的回呼分數。此目標指標僅對多類別分類有效。 |
最大化 |
test:mse |
測試資料集之最終模型的均方誤差。此目標指標僅對迴歸有效。 |
最小化 |
test:multiclass_accuracy |
測試資料集之最終模型的準確性。此目標指標僅對多類別分類有效。 |
最大化 |
test:multiclass_top_k_accuracy |
測試資料集之預測的前 k 個標籤之間的準確性。如果您選擇此指標做為目標,建議您使用 |
最大化 |
test:objective_loss |
模型訓練後之測試資料集的目標遺失函式平均值。根據預設,遺失是二元分類的邏輯遺失和迴歸的平方遺失。若要將遺失設定成其他類型,請使用 |
最小化 |
test:precision |
測試資料集之最終模型的精確度。如果您選擇此指標做為目標,建議您將 |
最大化 |
test:recall |
測試資料集之最終模型的回呼。如果您選擇此指標做為目標,建議您將 |
最大化 |
test:roc_auc_score |
測試資料集之最終模型接收操作特徵曲線 (ROC 曲線) 以下的區域。此目標指標僅對二元分類有效。 |
最大化 |
validation:absolute_loss |
驗證資料集之最終模型的絕對損失。此目標指標僅對迴歸有效。 |
最小化 |
validation:binary_classification_accuracy |
驗證資料集之最終模型的準確性。此目標指標僅對二元分類有效。 |
最大化 |
validation:binary_f_beta |
驗證資料集之最終模型的 F-beta 分數。根據預設,F-beta 分數是 F1 分數,這是 |
最大化 |
validation:dcg |
驗證資料集之最終模型的折扣累積增益。此目標指標僅對多類別分類有效。 |
最大化 |
validation:macro_f_beta |
驗證資料集之最終模型的 F-beta 分數。此目標指標僅對多類別分類有效。 |
最大化 |
validation:macro_precision |
驗證資料集之最終模型的精準度分數。此目標指標僅對多類別分類有效。 |
最大化 |
validation:macro_recall |
驗證資料集之最終模型的回呼分數。此目標指標僅對多類別分類有效。 |
最大化 |
validation:mse |
驗證資料集之最終模型的均方誤差。此目標指標僅對迴歸有效。 |
最小化 |
validation:multiclass_accuracy |
驗證資料集之最終模型的準確性。此目標指標僅對多類別分類有效。 |
最大化 |
validation:multiclass_top_k_accuracy |
驗證資料集之預測的前 k 個標籤之間的準確性。如果您選擇此指標做為目標,建議您使用 |
最大化 |
validation:objective_loss |
驗證資料集每個 epoch 上目標遺失函式的平均值。根據預設,遺失是二元分類的邏輯遺失和迴歸的平方遺失。若要將遺失設定成其他類型,請使用 |
最小化 |
validation:precision |
驗證資料集之最終模型的精準度。如果您選擇此指標做為目標,建議您將 |
最大化 |
validation:recall |
驗證資料集之最終模型的回呼。如果您選擇此指標做為目標,建議您將 |
最大化 |
validation:rmse |
驗證資料集之最終模型的均方根誤差。此目標指標僅對迴歸有效。 |
最小化 |
validation:roc_auc_score |
驗證資料集之最終模型接收操作特徵曲線 (ROC 曲線) 以下的區域。此目標指標僅對二元分類有效。 |
最大化 |
調校線性學習程式超參數
您可以使用以下超參數調校線性學習程式模型。
參數名稱 | 參數類型 | 建議範圍 |
---|---|---|
wd |
|
|
l1 |
|
|
learning_rate |
|
|
mini_batch_size |
|
|
use_bias |
|
|
positive_example_weight_mult |
|
|