Regression - Amazon Machine Learning

Amazon Machine Learning サービスの更新や新規ユーザーの受け入れは終了しました。このドキュメントは既存のユーザー向けに提供されていますが、更新は終了しています。詳細については、「」を参照してください。Amazon Machine Learning

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Regression

回帰タスクの場合、一般的な精度メトリクスは、二乗平均平方根誤差 (RMSE) および平均絶対誤差率 (MAPE) です。これらのメトリクスでは、予測された数値ターゲットと実際の数値解の間の距離を測定します (グランドトゥルース)。Amazon ML では、回帰モデルの予測の正確性を評価するために RMSE メトリクスが使用されます。

図 3: 回帰モデルの残余の分布

回帰問題では残余をレビューするのが一般的な方法です。評価データの観測の残余とは、真のターゲットと予測されたターゲットの違いを意味しています。残余は、モデルが予測できないターゲットの部分を表しています。正の残余は、モデルがターゲットを過少評価している (実際のターゲットが予測ターゲットより大きい) ことを示します。負の残余は、モデルがターゲットを過大評価している (実際のターゲットが予測ターゲットより小さい) ことを示します。評価データの残余のヒストグラムが、ゼロを中心とするベル形状で分布している場合、モデルがランダムにミスを犯していて、ターゲット値の特定の範囲で体系的に過大予測または過小予測していないことを示します。残余がゼロを中心としたベル形状にならない場合、モデルの予測エラーに何かの構造が存在しています。モデルに変数を追加すると、現在のモデルでキャプチャしていないパターンをモデルがキャプチャする役に立つかもしれません。