SageMaker で自動モデルチューニングを実行する - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

SageMaker で自動モデルチューニングを実行する

Amazon SageMaker の自動モデルチューニングはハイパーパラメータチューニングとも呼ばれ、指定したアルゴリズムとハイパーパラメータの範囲を使って、データセットに対し多数のトレーニングジョブを実行することで、モデルの最適なバージョンを見つけます。さらに、選択したメトリクスでの測定に基づいて、最もパフォーマンスの高いモデルになるハイパーパラメータ値を選択します。

たとえば、マーケティングデータセットの二項分類問題を解決するとします。目標は、XGBoost アルゴリズム モデルをトレーニングすることにより、アルゴリズムのカーブの下の領域 (auc) メトリクスを最大化することです。etaalphamin_child_weightmax_depth ハイパーパラメータのどの値を使用すれば最善のモデルをトレーニングできるのかはまだわかっていないとします。これらのハイパーパラメータに最適な値を見つけるために、SageMaker ハイパーパラメータチューニングが検索する値の範囲を指定します。これにより、選択した目標メトリクスで測定した場合に最善の結果をもたらすトレーニングジョブを生成できます。ハイパーパラメータ調整は、指定した範囲内のハイパーパラメータ値を使用するトレーニングジョブを開始し、最高の auc を実現するトレーニングジョブを返します。

組み込みアルゴリズム、カスタムアルゴリズム、および機械学習フレームワーク用の SageMaker の事前作成済みコンテナを使った、SageMaker 自動モデルチューニングを使うことができます。

Amazon SageMaker の自動モデルチューニングでは、Amazon EC2 スポットインスタンスを使って、トレーニングジョブ実行のコストを最適化できます。マネージドスポットトレーニングの詳細については、「Amazon SageMaker でのマネージドスポットトレーニング」を参照してください。

ハイパーパラメータ調整の使用を開始する前に、次のような明確な機械学習問題がすでに存在しています。

  • データセット

  • トレーニングする必要があるアルゴリズムのタイプの理解

  • どのように成功を測定するかについての明確な理解

SageMaker で機能し、トレーニングジョブを 1 回以上正常に実行できるように、データセットとアルゴリズムも準備する必要があります。トレーニングジョブの設定方法および実行方法については、「Amazon SageMaker の使用を開始する」を参照してください。