Evalúe sus DeepRacer modelos de AWS en una simulación

Una vez completada su tarea de entrenamiento, debe evaluar el modelo entrenado para evaluar su comportamiento de convergencia. La evaluación procede completando una serie de ensayos en una pista elegida y haciendo que el agente se mueva en la pista de acuerdo con las posibles acciones inferidas por el modelo entrenado. Las métricas de rendimiento incluyen un porcentaje de finalización de la pista y el tiempo de ejecución en cada pista desde el principio hasta el final o la salida de la pista.

Para evaluar su modelo entrenado, puede usar la DeepRacer consola de AWS. Para ello, siga los pasos de este tema.

Para evaluar un modelo entrenado en la DeepRacer consola de AWS

Abra la DeepRacer consola de AWS en https://console.aws.amazon.com /deepracer.
En el panel de navegación principal, elija Models (Modelos) y, a continuación, elija el modelo que acaba de entrenar en la lista Models (Modelos) para abrir la página de detalles del modelo.
Seleccione la pestaña Evaluación.
En Evaluación, elija Comenzar la evaluación.

Puede iniciar una evaluación después de que el estado de la tarea de entrenamiento cambie a Completed (Completado) o el estado del modelo cambie a Ready (Listo) si la tarea de entrenamiento no se ha completado.

Un modelo está preparado cuando se completa la tarea de entrenamiento. Si el entrenamiento no se completó, el modelo también puede estar en estado Ready (Listo) si está entrenado hasta el punto de falla.
En la página Evaluar modelo dentro de Tipo de carrera, elija el tipo de carrera que eligió para entrenar al modelo.

Para la evaluación se puede elegir un tipo de carrera diferente al tipo de carrera utilizado en el entrenamiento. Por ejemplo, puede entrenar un modelo para head-to-bot las carreras y luego evaluarlo para las contrarreloj. En general, el modelo debe generalizarse bien si el tipo de carrera del entrenamiento difiere del tipo de carrera de la evaluación. Para su primera ejecución, debe usar el mismo tipo de carrera tanto para la evaluación como para el entrenamiento.
En la página Evaluar modelo, dentro de Evaluar criterios, elija el número de pruebas que desea utilizar para evaluar el modelo.

Por norma general, es conveniente que elija una pista que sea igual o similar a la que utilizó en el entrenamiento del modelo. Puede elegir cualquier pista para evaluar su modelo, sin embargo, que puede esperar el mejor rendimiento en la pista más parecida a la utilizada en el entrenamiento.

Para ver si su modelo generaliza bien, elija una pista de evaluación diferente a la utilizada en el entrenamiento.
En la página Evaluate model (Evaluar modelo) en Virtual Race Submission (Envío de carrera virtual), en el primer modelo, desactive la opción Submit model after evaluation (Enviar modelo después de la evaluación) . Más tarde, si quiere participar en un evento de carreras, deje esta opción encendida.
En la página Evaluar modelo elija Iniciar evaluación para empezar a crear e inicializar la tarea de evaluación.

El proceso de inicialización tarda 3 minutos en completarse.
A medida que avanza la evaluación, los resultados de la evaluación, incluido el tiempo de prueba y la tasa de finalización del seguimiento, se muestran en Detalles de evaluación después de cada prueba. En la ventana Simulation video stream (Secuencia de vídeo de la simulación) puede ver cómo funciona el agente en la pista elegida.

Puede detener una tarea de evaluación antes de que se complete. Para detener una tarea de evaluación, seleccione Stop evaluation (Detener evaluación) en la esquina superior derecha del panel Evaluation (Evaluación) y, a continuación, confirme para detener la evaluación.
Una vez completado la tarea de evaluación, examine las métricas de rendimiento de todos los ensayos bajo Resultados de evaluación. El flujo de vídeo de la simulación que lo acompaña ya no está disponible.

El historial de las evaluaciones de su modelo está disponible en el Selector de evaluaciones. Para ver los detalles de una evaluación específica, seleccione la evaluación en la lista del selector de evaluaciones y, a continuación, elija Cargar evaluación en la esquina superior derecha de la tarjeta de Selección de evaluaciones.

Para este trabajo de evaluación en particular, el modelo entrenado completa las pruebas con una importante penalización de tiempo fuera de lo previsto. En una primera carrera, esto no es inusual. Las posibles razones incluyen que el entrenamiento no converge y que el entrenamiento necesita más tiempo, que el espacio de acción necesita ser ampliado para dar al agente más espacio para reaccionar, o que la función de recompensa necesita ser actualizada para manejar diferentes entornos.

Puede seguir mejorando el modelo clonando un modelo entrenado previamente, cambiando la función de recompensa, ajustando los hiperparámetros y, a continuación, mediante la iteración del proceso hasta que la recompensa total converge y las métricas de rendimiento mejoran. Para obtener más información acerca de cómo mejorar el entrenamiento, consulte Capacite y evalúe los DeepRacer modelos de AWS.

Para transferir su modelo completamente entrenado a su DeepRacer dispositivo de AWS para conducir en un entorno físico, debe descargar los artefactos del modelo. Para hacerlo, elija Download model (Descargar modelo) en la página de detalles del modelo. Si su dispositivo DeepRacer físico de AWS no admite sensores nuevos y su modelo ha sido entrenado con los nuevos tipos de sensores, recibirá un mensaje de error cuando utilice el modelo en su DeepRacer dispositivo de AWS en un entorno real. Para obtener más información sobre las pruebas de un DeepRacer modelo de AWS con un dispositivo físico, consulteOpere su DeepRacer vehículo de AWS .

Una vez que haya entrenado su modelo en una pista idéntica o similar a la especificada en un evento de carreras de DeepRacer la Liga AWS o en una carrera de la DeepRacer comunidad de AWS, puede enviar el modelo a las carreras virtuales en la DeepRacer consola de AWS. Para ello, siga AWS Circuito virtual o Carreras comunitarias en el panel de navegación principal. Para obtener más información, consulte Únase a una DeepRacer carrera de AWS.

Para entrenar a un modelo para evitar obstáculos o head-to-bot competir, es posible que necesite añadir nuevos sensores al modelo y al dispositivo físico. Para obtener más información, consulte Comprender los tipos de carreras y habilitar los sensores compatibles con AWS DeepRacer.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Entrenar su primer modelo

Entrenamiento y evaluación de modelos