Use o AWS DeepRacer para explorar o aprendizado por reforço - AWS DeepRacer

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Use o AWS DeepRacer para explorar o aprendizado por reforço

O aprendizado por reforço, especialmente o aprendizado por reforço profundo, provou ser eficaz na solução de uma ampla gama de problemas autônomos de tomada de decisão. Ele possui aplicações em operações financeiras, resfriamento de datacenter, logística de frota e corridas autônomas, entre outros.

O aprendizado por reforço tem o potencial de resolver problemas reais. No entanto, tem uma curva de aprendizado acentuada devido ao extenso escopo e profundidade tecnológica. A experimentação no mundo real requer a construção de um agente físico (por exemplo, um carro de corrida autônomo). Também requer a proteção de um ambiente físico, por exemplo, uma pista de corrida ou uma via pública. O ambiente pode ser caro, perigoso e demorar mais tempo. Esses requisitos vão além da compreensão do aprendizado por reforço.

Para ajudar a reduzir a curva de aprendizado, o AWS DeepRacer simplifica o processo de três maneiras:

  • Oferecendo um guia passo a passo ao treinar e avaliar modelos de aprendizado por reforço. O guia inclui ambientes predefinidos, estados, ações e funções de recompensa personalizáveis.

  • Fornecendo um simulador para emular interações entre um agente virtual e um ambiente virtual.

  • Usando um veículo do AWS DeepRacer como agente físico. Use o veículo para avaliar um modelo treinado em um ambiente físico. Isso é muito semelhante a um caso de uso real.

Se você é um praticante experiente de machine learning, achará o AWS DeepRacer uma boa oportunidade para criar modelos de aprendizado por reforço para corridas autônomas em ambientes virtuais e físicos. Para resumir, use o AWS DeepRacer para criar modelos de aprendizado por reforço para corridas autônomas seguindo as seguintes etapas:

  1. Treine um modelo personalizado de aprendizado por reforço para corridas autônomas. Faça isso usando o console do AWS DeepRacer integrado ao SageMaker.

  2. Use o simulador do AWS DeepRacer para avaliar um modelo e testar corridas autônomas em um ambiente virtual.

  3. Implante um modelo treinado em veículos modelo do AWS DeepRacer para testar corridas autônomas em um ambiente físico.