で自動モデルチューニングを実行する SageMaker - アマゾン SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

で自動モデルチューニングを実行する SageMaker

ハイパーパラメータチューニングとも呼ばれる Amazon SageMaker Model Tuning (AMT) は、データセットに対し多数のトレーニングジョブを実行することで、モデルの最適なバージョンを見つけます。そのために、AMT は指定したアルゴリズムとハイパーパラメータの範囲を使用します。次に、選択した指標で測定した結果、最適なパフォーマンスを発揮するモデルを作成するハイパーパラメータ値が選択されます。

たとえば、マーケティングデータセットの二項分類問題を解決するとします。目標は、XGBoost アルゴリズムモデルをトレーニングすることにより、アルゴリズムのカーブの下の領域 (AUC) メトリクスを最大化することです。最適なモデルをトレーニングするにはeta、、alphamin_child_weightmax_depthおよびハイパーパラメータのどの値が必要かを調べる必要があります。これらのハイパーパラメータの値の範囲を指定します。次に、 SageMaker ハイパーパラメータチューニングは、これらの範囲内を検索して値の組み合わせを見つけます。これにより、AUC が最も高いモデルを作成するトレーニングジョブが作成されます。リソースを節約したり、特定のモデル品質に対する期待に応えたりするために、完了基準を設定して、基準が満たされた後にチューニングを停止することもできます。

組み込みアルゴリズム、カスタムアルゴリズム、 SageMaker または機械学習フレームワーク用の事前作成済みコンテナを使った SageMaker AMT を使うことができます。

SageMaker AMT は、Amazon EC2 スポットインスタンスを使って、トレーニングジョブ実行のコストを最適化できます。詳細については、「Amazon でのマネージドスポットトレーニング SageMaker」を参照してください。

ハイパーパラメータ調整の使用を開始する前に、次のような明確な機械学習問題がすでに存在しています。

  • データセット

  • トレーニングが必要なアルゴリズムの種類に関する理解

  • どのように成功を測定するかについての明確な理解

データセットとアルゴリズムを、 SageMaker トレーニングジョブで機能し、トレーニングジョブを 1 回以上正常に実行できるように準備します。トレーニングジョブの設定方法および実行方法については、「Amazon の使用を開始する SageMaker」を参照してください。