k-NN モデルの調整 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

k-NN モデルの調整

Amazon SageMaker K 最近傍アルゴリズムは教師ありアルゴリズムです。このアルゴリズムはテストデータセットを消費し、分類タスクの精度または回帰タスクの平均二乗誤差に関するメトリクスを出力します。これらの精度メトリクスは、それぞれのタスクについてのモデル予測を経験的テストデータによって提供されるグランドトゥルースと比較します。テストデータセットで最高の精度または最低の誤差を報告する最善のモデルを見つけるには、k-NN のハイパーパラメータ調整ジョブを実行します。

自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、データセットのさまざまなハイパーパラメータをテストする多数のジョブを実行して、モデルの最適なバージョンを見つけます。調整可能なハイパーパラメータ、それぞれの値の範囲、および目標メトリクスを選択します。アルゴリズムの予測タスクに適した目標メトリクスを選択します。自動モデル調整は、選択されたハイパーパラメータを検索して、目標メトリクスを最適化するモデルになる値の組み合わせを見つけます。ハイパーパラメータは、モデルパラメータの推定を支援する目的でのみ使用され、予測を行うためにトレーニングされたモデルでは使用されません。

モデル調整の詳細については、「で自動モデルチューニングを実行する SageMaker」を参照してください。

k-NN アルゴリズムによって計算されたメトリクス

k 最近傍アルゴリズムは、predictor_type ハイパーパラメータで指定されたタスクのタイプに応じて、トレーニング中に次の表の 2 つのメトリクスのいずれかを計算します。

  • classifier は分類タスクを指定し、test:accuracy を計算します。

  • regressor は回帰タスクを指定し、test:mse を計算します。

モデルを調整するときに、関連する目標メトリクスを計算するために実行されるタスクのタイプに適した predictor_type 値を選択してください。

メトリクス名 説明 最適化の方向
test:accuracy

predictor_typeclassifier に設定されている場合、k-NN は、K 最近傍のラベルの平均に基づいて予測されたラベルを、テストチャネルデータで提供されたグランドトゥルースラベルと比較します。報告される精度は、0.0 (0%) ~ 1.0 (100%) の範囲です。

最大化

test:mse

predictor_typeregressor に設定されている場合、k-NN は、K 最近傍のラベルの平均に基づいて予測されたラベルを、テストチャネルデータで提供されたグランドトゥルースラベルと比較します。平均二乗誤差は、2 つのラベルを比較することによって計算されます。

最小化

調整可能な k-NN ハイパーパラメータ

次のハイパーパラメータを使用して、Amazon SageMaker K 最近傍モデルを調整します。

Parameter Name パラメータタイプ 推奨範囲
k

IntegerParameterRanges

MinValue: 1、 MaxValue: 1024

sample_size

IntegerParameterRanges

MinValue: 256、 MaxValue: 20000000