AWS DeepRacer를 사용하여 강화 학습을 탐색합니다. - AWS DeepRacer

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

AWS DeepRacer를 사용하여 강화 학습을 탐색합니다.

강화 학습, 특히 심층 강화 학습은 광범위한 자율 의사결정 문제를 해결하는 데 그 효율성을 이미 입증했으며, 두 세 가지 예만 들자면, 금융 거래, 데이터 센터 냉각, 병참 및 자율 레이싱 등에서 응용되고 있습니다.

강화 학습은 실제 문제를 해결할 수 있는 잠재력을 가지고 있습니다. 하지만 광범위한 기술 범위와 전문성으로 인해 학습 곡선이 가파릅니다. 실제 실험을 진행하려면 자율 주행 레이싱 자동차와 같은 물리적 에이전트가 필요합니다. 또한 주행 트랙 또는 공공도로와 같은 물리적 환경도 확보해야 합니다. 이러한 환경은 비용과 시간이 많이 들고, 위험할 수 있습니다. 단순히 강화 학습을 이해하는 것만으로는 이러한 요건들을 해결하지 못합니다.

학습 곡선을 완만하게 만들기 위해 AWS DeepRacer에서는 다음 3가지 방법으로 프로세스를 간소화했습니다.

  • 강화 학습 모델을 훈련하고 평가할 때 단계별 지침을 제공합니다. 이 지침에는 사전 설정된 환경, 상태 및 행동과 사용자 지정이 가능한 보상 함수가 포함되어 있습니다.

  • 가상 에이전트와 가상 환경 간 상호 작용을 에뮬레이션하는 시뮬레이터를 제공합니다.

  • AWS DeepRacer 차량을 물리적 에이전트로 사용. 이 차량을 사용해 훈련된 모델을 물리적 환경에서 평가할 수 있습니다. 이는 실제 사용 사례와 매우 유사합니다.

숙련된 기계 학습 전문가들에게 AWS DeepRacer는 가상 환경과 물리적 환경에서 자율 레이싱을 위한 강화 학습 모델을 개발할 수 있는 통합 시스템으로 손색이 없습니다. 요컨대, AWS DeepRacer를 사용해 다음 단계에 따라 자율 주행이 가능한 강화 학습 모델을 개발할 수 있습니다.

  1. 자율 레이싱을 위한 맞춤형 강화 학습 모델을 훈련합니다. SageMaker와 통합된 AWS DeepRacer 콘솔을 사용하여 작업을 수행할 수 있습니다.

  2. AWS DeepRacer 시뮬레이터를 사용해 가상 환경에서 모델을 평가하고 자율 주행 레이싱을 테스트합니다.

  3. 훈련된 모델을 AWS DeepRacer 모형 차량에 배포하여 물리적 환경에서 자율 주행을 테스트합니다.