Detalles de los resultados de la prueba - Amazon Lex

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Detalles de los resultados de la prueba

Los resultados de la prueba muestran los detalles del conjunto de prueba, las intenciones utilizadas y los slots usados. También proporciona el desglose general de las entradas del conjunto de prueba, que incluye los resultados generales, los resultados de la conversación, la intención y los resultados de los slots.

Los resultados de las pruebas incluyen toda la información relacionada con las pruebas, como:

  • Metadatos de detalles de prueba

  • Resultados generales

  • Resultados de la conversación

  • Resultados de intención y slot

  • Resultados detallados

Pestaña de resultados generales:

El gráfico de desglose de entradas del conjunto de prueba en los resultados de las pruebas utilizando el Test Workbench.

Desglose de entradas del conjunto de prueba: este gráfico muestra el desglose del número de conversaciones y enunciados de entrada única en el conjunto de prueba.

El gráfico de desglose de entrada única en los resultados de las pruebas utilizando el Test Workbench.

Desglose de una sola entrada: muestra dos gráficos que incluyen end-to-end conversaciones y transcripciones de voz. El número de entradas aprobadas y fallidas se indica en cada gráfico. Nota: La tabla de transcripción de voz solo estará visible para el conjunto de prueba de audio.

El gráfico de desglose de conversación en los resultados de las pruebas utilizando el Test Workbench.

Desglose de las conversaciones: muestra dos gráficos que incluyen end-to-end conversaciones y transcripciones de voz. El número de entradas aprobadas y fallidas se indica en cada gráfico. Nota: La tabla de transcripción de voz solo estará visible para el conjunto de prueba de audio.

Pestaña de los resultados de la conversación:

El gráfico de las tasas de aprobación de conversaciones en los resultados de las pruebas utilizando el Test Workbench.

Tasas de aprobación de conversaciones: la tabla de tasas de aprobación de conversaciones se utiliza para ver qué intenciones y slots se utilizan en cada conversación del conjunto de pruebas. Para ver dónde ha fallado la conversación, revise qué intención o slot falló, junto con el porcentaje de aprobaciones de cada intento y slot.

El gráfico de las métricas de fallos en la intención de la conversación en los resultados de las pruebas utilizando el Test Workbench.

Métricas de fallos en la intención de la conversación: esta métrica muestra las cinco intenciones con peor rendimiento del conjunto de prueba. En este panel se muestra un gráfico con el porcentaje o el número de intenciones que tuvieron éxito o fallaron, en función de los registros de conversaciones o de la transcripción del bot. Una intención exitosa no significa que toda la conversación haya sido un éxito. Estas métricas solo se aplican al valor de las intenciones, independientemente de la intención anterior o posterior.

El gráfico de las métricas de fallos en los slots de la conversación en los resultados de las pruebas utilizando el Test Workbench.

Métricas de fallos en el slot de la conversación: esta métrica muestra los cinco slots con peor rendimiento del conjunto de prueba. Indicó la tasa de éxito de cada slot de la intención. El gráfico de barras muestra tanto la transcripción del discurso como end-to-end las conversaciones para cada espacio de la intención.

Pestaña de resultados de intención y slot:

El gráfico de las métricas de reconocimiento de intenciones en los resultados de las pruebas utilizando el Test Workbench.

Métricas de reconocimiento de intenciones: muestra una tabla de cuántas intenciones se reconocieron correctamente. Muestra la tasa de aprobación de la transcripción del discurso y de end-to-end las conversaciones.

El gráfico de las métricas de resolución de slots en los resultados de las pruebas utilizando el Test Workbench.

Métricas de resolución de slots: muestra las intenciones y los slots por separado, así como la tasa de éxito y fracaso de cada slot para cada intención utilizada en la conversación o en una sola entrada. Muestra la tasa de aprobación de la transcripción de voz y end-to-end las conversaciones.

Pestaña de resultados detallados:

Los resultados detallados en los resultados de las pruebas realizadas con el Test Workbench.

Resultados detallados: muestra una tabla detallada en el registro de conversaciones con los enunciados del usuario y el agente, así como el resultado esperado y la transcripción prevista para cada slot. Puede descargar este informe pulsando el botón Descargar.

En la siguiente tabla se enumeran los mensajes de error de fallos de resultados con escenarios.

Escenario Mensaje de error Acción
Discrepancia de intenciones BookFlight Intención esperada, pero era BookHotel intención.

Sáltese otros turnos de la conversación

Discrepancia en la obtención de slots Se esperaba que se abriera el slot FechaDeSalida, pero era TipoDeCabina. Sáltese otros turnos de la conversación
Discrepancia en el valor del slot Discrepancia entre el valor esperado y el real de los slots. Continúe con los demás turnos de las conversaciones
Falta ack-to-back el aviso del agente B. Se esperaba que el bot devolviera un mensaje de agente en este turno, pero no lo recibió. Sáltese otros turnos de la conversación
Discrepancia en la transcripción La transcripción esperada no coincidía con la transcripción real. Continúe con los demás turnos de las conversaciones
No se ha obtenido el slot opcional Se espera que aparezca el slot TipoDeCabina en el siguiente turno, sin embargo, la intención actual se cumplió antes de eso. Sáltese otros turnos de la conversación
Slot no reconocido El slot esperado FechaDeSalida no se reconoció en este turno. Sáltese otros turnos de la conversación
Aviso de back-to-back agente adicional Se esperaba un turno de usuario, pero fue un aviso del agente Sáltese otros turnos de la conversación