新しいデータでのモデルの再トレーニング - Amazon Machine Learning

Amazon Machine Learning サービスの更新や、その新しいユーザーの受け入れは行っていません。このドキュメントは既存のユーザー向けに提供されていますが、更新は終了しています。詳細については、「Amazon Machine Learning とは」を参照してください。

新しいデータでのモデルの再トレーニング

モデルが精度の高い予測をするためには、予測の基になっているデータが、モデルがトレーニングされたデータと同様の分布を持っている必要があります。データの分布は時間の経過とともに変化することが予想されるため、モデルのデプロイは、1 回限り実行されるのではなく、むしろ連続的な処理です。データの分布が元のトレーニングデータの分布から大幅に逸脱していることがわかったら、受信データを継続的に監視し、より新しいデータでモデルを再トレーニングすることをお勧めします。データ配信における変化を検出するための監視はオーバヘッドが大きいのであれば、より簡単な戦略は、たとえば、毎日、毎週、または毎月など、定期的にモデルをトレーニングすることです。Amazon ML でモデルを再トレーニングするには、新しいトレーニングデータに基づいて新しいモデルを作成する必要があります。