LightGBM アルゴリズムの Amazon EC2 インスタンスに関する推奨事項サンプルノートブック

LightGBM

LightGBM は、よく知られた効率的な勾配ブースト決定木アルゴリズムのオープンソースを実装したものです。GBDT は、一連のより単純でより弱いモデルから得られた推定のアンサンブルを組み合わせることで、ターゲット変数の正確な予測を試みる、教師あり学習アルゴリズムです。LightGBM は、追加の手法を使用し、従来の GBDT の効率とスケーラビリティを大幅に向上させています。このページには、LightGBM の Amazon EC2 インスタンスに関する推奨事項とサンプルノートブックについての情報が含まれています。

LightGBM アルゴリズムの Amazon EC2 インスタンスに関する推奨事項

SageMaker AI LightGBM は現在、単一インスタンスおよび複数インスタンスの CPU トレーニングをサポートしています。マルチインスタンスの CPU トレーニング (分散トレーニング) の場合、推定器を定義するときに 1 より大きい instance_count を指定します。LightGBM による分散トレーニングの詳細については、Amazon SageMaker AI LightGBM Distributed training using Dask」を参照してください。

LightGBM は (CPU バウンドではなく) メモリバウンドアルゴリズムです。そのため、コンピューティング最適化インスタンス (C5 など) よりも汎用コンピューティングインスタンス (M5 など) を選択することをお勧めします。さらに、トレーニングデータを保持するために、選択したインスタンスに十分なメモリを用意することを推奨します。

LightGBM サンプルノートブック

次の表は、Amazon SageMaker AI LightGBM アルゴリズムのさまざまなユースケースに対応するさまざまなサンプルノートブックの概要を示しています。

ノートブックのタイトル	説明
Amazon SageMaker AI LightGBM および CatBoost アルゴリズムによる表形式分類	このノートブックでは、Amazon SageMaker AI LightGBM アルゴリズムを使用して表形式の分類モデルをトレーニングおよびホストする方法を示します。
Amazon SageMaker AI LightGBM および CatBoost アルゴリズムを使用した表形式の回帰	このノートブックでは、Amazon SageMaker AI LightGBM アルゴリズムを使用して表形式の回帰モデルをトレーニングおよびホストする方法を示します。
Dask を使用した Amazon SageMaker AI LightGBM 分散トレーニング	このノートブックでは、Dask フレームワークを使用した Amazon SageMaker AI LightGBM アルゴリズムによる分散トレーニングを示します。

SageMaker AI で例を実行するために使用できる Jupyter ノートブックインスタンスを作成してアクセスする方法については、「」を参照してくださいAmazon SageMaker ノートブックインスタンス。ノートブックインスタンスを作成して開いたら、SageMaker AI Examples タブを選択して、すべての SageMaker AI サンプルのリストを表示します。ノートブックを開くには、その [Use (使用)] タブを選択し、[Create copy (コピーを作成)] を選択します。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

推論の形式

LightGBM の使用方法