翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
AWS DeepRacer を使用して強化学習を試してみる
強化学習、特に深層強化学習は、幅広い自律的な意思決定問題を解決するのに効果的であることが証明されています。いくつか例を挙げると、金融取引、データセンターの冷却、フリート実務体制管理、自動運転レースでの用途があります。
強化学習は、実社会の問題を解決する可能性を秘めています。ただし、その幅広い技術範囲と深さのため、習得には時間がかかります。実際の実験では、自律型レーシングカーなどの物理エージェントを構築する必要があります。また、ドライビングトラックや公道などの物理的環境を確保する必要もあります。環境には費用がかかり、危険で、時間もかかる可能性があります。これらの要件は単に強化学習を理解することを超えています。
学習曲線を緩やかにするために、AWS は 3 DeepRacer つの方法でプロセスを簡略化します。
-
step-by-step 強化学習モデルのトレーニングと評価に関するガイダンスを提供します。ガイダンスには、事前に定義された環境、状態、アクション、カスタマイズ可能な報酬機能が含まれています。
-
AWS DeepRacer 車両を物理エージェントとして使用します。車両を使用して、物理的環境でトレーニングされたモデルを評価します。これは、実際のユースケースに非常に類似しています。
経験豊富な機械学習実務者にとって、AWS DeepRacer は、仮想環境と物理環境の両方で自律型レースのための強化学習モデルを構築する、歓迎すべき機会となるでしょう。要約すると、AWS DeepRacer を使用して、次のステップで自走型レースのための強化学習モデルを作成します。
自走型レースのため、カスタム強化学習モデルをトレーニングします。そのためには、と AWS SageMaker と統合された AWS DeepRacer コンソールを使用します RoboMaker。
AWS DeepRacer シミュレーターを使用して、モデルを評価し、仮想環境で自走型レースをテストします。
トレーニングされたモデルを AWS DeepRacer モデル車両にデプロイして、自走型レースを物理環境で自走型レースをテストします。