Evaluar los modelos de AWS DeepRacer en simulación - AWS DeepRacer

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Evaluar los modelos de AWS DeepRacer en simulación

Una vez completada su tarea de entrenamiento, debe evaluar el modelo entrenado para evaluar su comportamiento de convergencia. La evaluación procede completando una serie de ensayos en una pista elegida y haciendo que el agente se mueva en la pista de acuerdo con las posibles acciones inferidas por el modelo entrenado. Las métricas de rendimiento incluyen un porcentaje de finalización de la pista y el tiempo de ejecución en cada pista desde el principio hasta el final o la salida de la pista.

Para evaluar su modelo entrenado, puede usar la consola de AWS DeepRacer. Para ello, siga los pasos de este tema.

Para evaluar un modelo entrenado en la consola de AWS DeepRacer
  1. Abra la consola de AWS DeepRacer en https://console.aws.amazon.com/deepracer.

  2. En el panel de navegación principal, elija Models (Modelos) y, a continuación, elija el modelo que acaba de entrenar en la lista Models (Modelos) para abrir la página de detalles del modelo.

  3. Seleccione la pestaña Evaluación.

  4. En Evaluación, elija Comenzar la evaluación.

    Puede iniciar una evaluación después de que el estado de la tarea de entrenamiento cambie a Completed (Completado) o el estado del modelo cambie a Ready (Listo) si la tarea de entrenamiento no se ha completado.

    Un modelo está preparado cuando se completa la tarea de entrenamiento. Si el entrenamiento no se completó, el modelo también puede estar en estado Ready (Listo) si está entrenado hasta el punto de falla.

  5. En la página Evaluar modelo dentro de Tipo de carrera, elija el tipo de carrera que eligió para entrenar al modelo.

    Para la evaluación se puede elegir un tipo de carrera diferente al tipo de carrera utilizado en el entrenamiento. Por ejemplo, puede entrenar un modelo para carreras competitivas y luego evaluarlo en el modo contrarreloj. En general, el modelo debe generalizarse bien si el tipo de carrera del entrenamiento difiere del tipo de carrera de la evaluación. Para su primera ejecución, debe usar el mismo tipo de carrera tanto para la evaluación como para el entrenamiento.

  6. En la página Evaluar modelo, dentro de Evaluar criterios, elija el número de pruebas que desea utilizar para evaluar el modelo.

    
                    Imagen: AWS DeepRacer selecciona una pista para la evaluación.

    Por norma general, es conveniente que elija una pista que sea igual o similar a la que utilizó en el entrenamiento del modelo. Puede elegir cualquier pista para evaluar su modelo, sin embargo, que puede esperar el mejor rendimiento en la pista más parecida a la utilizada en el entrenamiento.

    Para ver si su modelo generaliza bien, elija una pista de evaluación diferente a la utilizada en el entrenamiento.

  7. En la página Evaluate model (Evaluar modelo) en Virtual Race Submission (Envío de carrera virtual), en el primer modelo, desactive la opción Submit model after evaluation (Enviar modelo después de la evaluación) . Más tarde, si quiere participar en un evento de carreras, deje esta opción encendida.

  8. En la página Evaluar modelo elija Iniciar evaluación para empezar a crear e inicializar la tarea de evaluación.

    El proceso de inicialización tarda 3 minutos en completarse.

  9. A medida que avanza la evaluación, los resultados de la evaluación, incluido el tiempo de prueba y la tasa de finalización del seguimiento, se muestran en Detalles de evaluación después de cada prueba. En la ventana Simulation video stream (Secuencia de vídeo de la simulación) puede ver cómo funciona el agente en la pista elegida.

    Puede detener una tarea de evaluación antes de que se complete. Para detener una tarea de evaluación, seleccione Stop evaluation (Detener evaluación) en la esquina superior derecha del panel Evaluation (Evaluación) y, a continuación, confirme para detener la evaluación.

  10. Una vez completado la tarea de evaluación, examine las métricas de rendimiento de todos los ensayos bajo Resultados de evaluación. El flujo de vídeo de la simulación que lo acompaña ya no está disponible.

    El historial de las evaluaciones de su modelo está disponible en el Selector de evaluaciones. Para ver los detalles de una evaluación específica, seleccione la evaluación en la lista del selector de evaluaciones y, a continuación, elija Cargar evaluación en la esquina superior derecha de la tarjeta de Selección de evaluaciones.

    
                    Imagen: rendimiento de evaluación de AWS DeepRacer completado.

    Para este trabajo de evaluación en particular, el modelo entrenado completa las pruebas con una importante penalización de tiempo fuera de lo previsto. En una primera carrera, esto no es inusual. Las posibles razones incluyen que el entrenamiento no converge y que el entrenamiento necesita más tiempo, que el espacio de acción necesita ser ampliado para dar al agente más espacio para reaccionar, o que la función de recompensa necesita ser actualizada para manejar diferentes entornos.

    Puede seguir mejorando el modelo clonando un modelo entrenado previamente, cambiando la función de recompensa, ajustando los hiperparámetros y, a continuación, mediante la iteración del proceso hasta que la recompensa total converge y las métricas de rendimiento mejoran. Para obtener más información acerca de cómo mejorar el entrenamiento, consulte Entrenamiento y evaluación de modelos de AWS DeepRacer.

Para transferir su modelo completamente entrenado a su vehículo de AWS DeepRacer para la conducción en un entorno físico, debe descargar los artefactos del modelo. Para hacerlo, elija Download model (Descargar modelo) en la página de detalles del modelo. Si su vehículo físico de AWS DeepRacer no admite nuevos sensores y su modelo ha sido entrenado con los nuevos tipos de sensores, recibirá un mensaje de error cuando utilice el modelo en su vehículo de AWS DeepRacer en un entorno real. Para obtener más información acerca de cómo probar un modelo de AWS DeepRacer con un agente físico, consulte Opere su vehículo AWS DeepRacer .

Si ha entrenado a su modelo en una pista idéntica o similar a la especificada en un evento de carreras de AWS DeepRacer o una carrera comunitaria de AWS DeepRacer, puede enviar el modelo a las carreras virtuales en la consola de AWS DeepRacer. Para ello, siga AWSCircuito virtual o Carreras comunitarias en el panel de navegación principal. Para obtener más información, consulte Únase a una carrera de AWS DeepRacer.

Para entrenar un modelo para evitar obstáculos o carreras competitivas, es posible que necesite añadir nuevos sensores al modelo y al dispositivo físico. Para obtener más información, consulte Comprensión de los tipos de carreras y habilitación de sensores admitidos por AWS DeepRacer.