を使用して自動モデルチューニングを実行する SageMaker - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

を使用して自動モデルチューニングを実行する SageMaker

アマゾン SageMaker 自動モデルチューニングはハイパーパラメータチューニングとも呼ばれ、指定したアルゴリズムとハイパーパラメータの範囲を使って、データセットに対し多数のトレーニングジョブを実行することで、モデルの最適なバージョンを見つけます。さらに、選択したメトリクスでの測定に基づいて、最もパフォーマンスの高いモデルになるハイパーパラメータ値を選択します。

たとえば、マーケティングデータセットの二項分類問題を解決するとします。目標は、XGBoost アルゴリズム モデルをトレーニングすることにより、アルゴリズムのカーブの下の領域 (auc) メトリクスを最大化することです。etaalphamin_child_weightmax_depth ハイパーパラメータのどの値を使用すれば最善のモデルをトレーニングできるのかはまだわかっていないとします。これらのハイパーパラメータに最適な値を求めるには、次のような値の範囲を指定できます。 SageMaker ハイパーパラメータチューニングでは、選択した目標メトリクスで測定した場合に最善の結果をもたらすトレーニングジョブを生成するための値の組み合わせを検索します。ハイパーパラメータ調整は、指定した範囲内のハイパーパラメータ値を使用するトレーニングジョブを開始し、最高の auc を実現するトレーニングジョブを返します。

以下を使用できます SageMaker 組み込みアルゴリズム、カスタムアルゴリズム、 SageMaker 機械学習フレームワーク用のビルド済みコンテナ。

アマゾン SageMaker 自動モデルチューニングでは、Amazon EC2 スポットインスタンスを使って、トレーニングジョブ実行のコストを最適化できます。マネージドスポットトレーニングの詳細については、「Amazon でのマネージドスポットトレーニング SageMaker」を参照してください。

ハイパーパラメータ調整の使用を開始する前に、次のような明確な機械学習問題がすでに存在しています。

  • データセット

  • トレーニングする必要があるアルゴリズムのタイプの理解

  • どのように成功を測定するかについての明確な理解

データセットとアルゴリズムも準備する必要があります SageMaker トレーニングジョブを少なくとも1回は正常に実行してください。トレーニングジョブの設定方法および実行方法については、「Amazon の使用を開始する SageMaker」を参照してください。