Detalles de los resultados de la prueba en Test Workbench

Los resultados de la prueba muestran los detalles del conjunto de prueba, las intenciones utilizadas y los slots usados. También proporciona el desglose general de las entradas del conjunto de prueba, que incluye los resultados generales, los resultados de la conversación, la intención y los resultados de los slots.

Los resultados de las pruebas incluyen toda la información relacionada con las pruebas, como:

Metadatos de detalles de prueba
Resultados generales
Resultados de la conversación
Resultados de intención y slot
Resultados detallados

Pestaña de resultados generales:

El conjunto de pruebas introduce un gráfico de desglose en los resultados de las pruebas mediante el Test Workbench.

Desglose de entradas del conjunto de prueba: este gráfico muestra el desglose del número de conversaciones y enunciados de entrada única en el conjunto de prueba.

El gráfico de desglose de entrada única en los resultados de las pruebas utilizando el Test Workbench.

Desglose de una sola entrada: muestra dos gráficos que incluyen end-to-end conversaciones y transcripciones de voz. El número de entradas aprobadas y fallidas se indica en cada gráfico. Nota: La tabla de transcripción de voz solo estará visible para el conjunto de prueba de audio.

El gráfico de desglose de conversación en los resultados de las pruebas utilizando el Test Workbench.

Desglose de las conversaciones: muestra dos gráficos que incluyen end-to-end conversaciones y transcripciones de voz. El número de entradas aprobadas y fallidas se indica en cada gráfico. Nota: La tabla de transcripción de voz solo estará visible para el conjunto de prueba de audio.

Pestaña de los resultados de la conversación:

El gráfico de las tasas de aprobación de conversaciones en los resultados de las pruebas utilizando el Test Workbench.

Tasas de aprobación de conversaciones: la tabla de tasas de aprobación de conversaciones se utiliza para ver qué intenciones y slots se utilizan en cada conversación del conjunto de pruebas. Para ver dónde ha fallado la conversación, revise qué intención o slot falló, junto con el porcentaje de aprobaciones de cada intento y slot.

El gráfico de las métricas de fallos en la intención de la conversación en los resultados de las pruebas utilizando el Test Workbench.

Métricas de fallos en la intención de la conversación: esta métrica muestra las cinco intenciones con peor rendimiento del conjunto de prueba. En este panel se muestra un gráfico con el porcentaje o el número de intenciones que tuvieron éxito o fallaron, en función de los registros de conversaciones o de la transcripción del bot. Una intención exitosa no significa que toda la conversación haya sido un éxito. Estas métricas solo se aplican al valor de las intenciones, independientemente de la intención anterior o posterior.

El gráfico de las métricas de fallos en los slots de la conversación en los resultados de las pruebas utilizando el Test Workbench.

Métricas de fallos en el slot de la conversación: esta métrica muestra los cinco slots con peor rendimiento del conjunto de prueba. Indicó la tasa de éxito de cada slot de la intención. El gráfico de barras muestra tanto la transcripción del discurso como end-to-end las conversaciones para cada espacio de la intención.

Pestaña de resultados de intención y slot:

El gráfico de las métricas de reconocimiento de intenciones en los resultados de las pruebas utilizando el Test Workbench.

Métricas de reconocimiento de intenciones: muestra una tabla de cuántas intenciones se reconocieron correctamente. Muestra la tasa de aprobación de la transcripción del discurso y de end-to-end las conversaciones.

El gráfico de las métricas de resolución de slots en los resultados de las pruebas utilizando el Test Workbench.

Métricas de resolución de slots: muestra las intenciones y los slots por separado, así como la tasa de éxito y fracaso de cada slot para cada intención utilizada en la conversación o en una sola entrada. Muestra la tasa de aprobación de la transcripción de voz y end-to-end las conversaciones.

Pestaña de resultados detallados:

Los resultados detallados en los resultados de las pruebas realizadas con el Test Workbench.

Resultados detallados: muestra una tabla detallada en el registro de conversaciones con los enunciados del usuario y el agente, así como el resultado esperado y la transcripción prevista para cada slot. Puede descargar este informe pulsando el botón Descargar.

En la siguiente tabla se enumeran los mensajes de error de fallos de resultados con escenarios.

Escenario	Mensaje de error	Acción
Discrepancia de intenciones	BookFlight Intención esperada, pero era BookHotel intención.	Sáltese otros turnos de la conversación
Discrepancia en la obtención de slots	Se esperaba que se abriera el slot FechaDeSalida, pero era TipoDeCabina.	Sáltese otros turnos de la conversación
Discrepancia en el valor del slot	Discrepancia entre el valor esperado y el real de los slots.	Continúe con los demás turnos de las conversaciones
Back-to-back falta el aviso del agente	Se esperaba que el bot devolviera un mensaje de agente en este turno, pero no lo recibió.	Sáltese otros turnos de la conversación
Discrepancia en la transcripción	La transcripción esperada no coincidía con la transcripción real.	Continúe con los demás turnos de las conversaciones
No se ha obtenido el slot opcional	Se espera que aparezca el slot TipoDeCabina en el siguiente turno, sin embargo, la intención actual se cumplió antes de eso.	Sáltese otros turnos de la conversación
Slot no reconocido	El slot esperado FechaDeSalida no se reconoció en este turno.	Sáltese otros turnos de la conversación
Aviso adicional para back-to-back el agente	Se esperaba un turno de usuario, pero fue un aviso del agente	Sáltese otros turnos de la conversación

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Ver resultados de la prueba

Transmisión de conversaciones a su bot Lex V2