LightGBM モデルを調整する - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

LightGBM モデルを調整する

自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、データセットのトレーニングと検証でさまざまなハイパーパラメータをテストする多数のジョブを実行して、モデルの最適なバージョンを見つけます。モデル調整は、次のハイパーパラメータに重点を置いています。

注記

学習目的関数は、ラベル列の一意の整数の数によって決定される分類タスクの種類に基づいて自動的に割り当てられます。詳細については、「LightGBM ハイパーパラメータ」を参照してください。

  • モデルトレーニング中に最適化する学習の目標関数

  • 検証中にモデルのパフォーマンスを評価するための評価指標

  • モデルの自動調整時に使用する一連のハイパーパラメータと各値の範囲

自動モデル調整は、指定されたハイパーパラメータを検索して、選択された評価メトリクスを最適化するモデルになる値の組み合わせを見つけます。

注記

LightGBM の自動モデル調整はAmazon SageMaker AI SDKs からのみ使用でき、SageMaker AI コンソールからは使用できません。

モデル調整の詳細については、「SageMaker AI による自動モデル調整」を参照してください。

LightGBM アルゴリズムで計算される評価メトリクス

SageMaker AI LightGBM アルゴリズムは、モデルの検証に使用する以下のメトリクスを計算します。評価メトリクスは、ラベル列の一意の整数の数によって決定される分類タスクの種類に基づいて自動的に割り当てられます。

メトリクス名 説明 最適化の方向 正規表現パターン
rmse 二乗平均平方根誤差 最小化 "rmse: ([0-9\\.]+)"
l1 平均絶対誤差 最小化 "l1: ([0-9\\.]+)"
l2 平均二乗誤差 最小化 "l2: ([0-9\\.]+)"
huber Huber 損失 最小化 "huber: ([0-9\\.]+)"
fair 公平性損失 最小化 "fair: ([0-9\\.]+)"
binary_logloss 二項交差エントロピー 最大化 "binary_logloss: ([0-9\\.]+)"
binary_error バイナリエラー 最小化 "binary_error: ([0-9\\.]+)"
auc AUC 最大化 "auc: ([0-9\\.]+)"
average_precision 平均適合率スコア 最大化 "average_precision: ([0-9\\.]+)"
multi_logloss マルチクラス交差エントロピー 最大化 "multi_logloss: ([0-9\\.]+)"
multi_error 多クラスエラースコア 最小化 "multi_error: ([0-9\\.]+)"
auc_mu AUC-mu 最大化 "auc_mu: ([0-9\\.]+)"
cross_entropy 交差エントロピー 最小化 "cross_entropy: ([0-9\\.]+)"

調整可能な LightGBM ハイパーパラメータ

次のハイパーパラメータを使用して LightGBM モデルを調整します。LightGBM 検証メトリクスの最適化に最も影響を与えるハイパーパラメータは、learning_ratenum_leavesfeature_fractionbagging_fractionbagging_freqmax_depth、および min_data_in_leaf です。すべての LightGBM ハイパーパラメータのリストについては、「LightGBM ハイパーパラメータ」を参照してください。

パラメータ名 パラメータタイプ 推奨範囲
learning_rate ContinuousParameterRanges MinValue: 0.001、MaxValue: 0.01
num_leaves IntegerParameterRanges MinValue: 10、MaxValue: 100
feature_fraction ContinuousParameterRanges MinValue: 0.1、MaxValue: 1.0
bagging_fraction ContinuousParameterRanges MinValue: 0.1、MaxValue: 1.0
bagging_freq IntegerParameterRanges MinValue: 0、MaxValue: 10
max_depth IntegerParameterRanges MinValue: 15、MaxValue: 100
min_data_in_leaf IntegerParameterRanges MinValue: 10、MaxValue: 200