Détails des résultats de test dans Test Workbench

Les résultats du test indiquent les détails du set de test, les intentions utilisées et les emplacements utilisés. Il fournit également la répartition globale des entrées du set de tests, y compris les résultats globaux, les résultats des conversations, l'intention et les résultats des créneaux.

Les résultats des tests comprennent toutes les informations relatives aux tests, telles que :

Métadonnées des détails du test
Résultats globaux
Résultats de la conversation
Intention et résultats des créneaux
Résultats détaillés

Onglet des résultats globaux :

Le tableau de répartition du set de test a été saisi dans les résultats des tests à l'aide du Test Workbench.

Répartition des entrées du set de test — Ce graphique montre la répartition du nombre de conversations et d'énoncés à entrée unique dans le set de test.

Le graphique de répartition à entrée unique dans les résultats de test à l'aide du Test Workbench.

Répartition par entrée unique : affiche deux graphiques qui incluent end-to-end les conversations et les transcriptions vocales. Le nombre d'entrées réussies et échouées est indiqué sur chaque graphique. Remarque : le tableau de transcription vocale ne sera visible que pour le set de test audio.

Le diagramme de répartition des conversations dans les résultats des tests à l'aide du Test Workbench.

Répartition des conversations : affiche deux graphiques qui incluent end-to-end les conversations et les transcriptions vocales. Le nombre d'entrées réussies et échouées est indiqué sur chaque graphique. Remarque : le tableau de transcription vocale ne sera visible que pour le set de test audio.

Onglet des résultats de conversation :

Le graphique des taux de réussite des conversations apparaît dans les résultats des tests réalisés à l'aide du Test Workbench.

Taux de réussite des conversations : le tableau des taux de réussite des conversations est utilisé pour voir quelles intentions et quels créneaux sont utilisés dans chaque conversation du set de test. Vous pouvez visualiser où la conversation a échoué en examinant quelle intention ou quel créneau a échoué, ainsi que le pourcentage de réussite de chaque intention et de chaque créneau.

Le graphique des indicateurs d'échec de l'intention de conversation apparaît dans les résultats des tests à l'aide du Test Workbench.

Indicateurs d'échec des intentions de conversation : cet indicateur indique les 5 intentions les moins performantes du test. Ce panneau affiche un graphique indiquant le pourcentage ou le nombre d'tentatives réussies ou échouées sur la base des journaux de conversation ou de la transcription du bot. Une intention réussie ne signifie pas que l'ensemble de la conversation a été couronné de succès. Ces mesures s'appliquent uniquement à la valeur des intentions, quelle que soit l'intention antérieure ou ultérieure.

Le graphique des indicateurs de défaillance des emplacements de conversation apparaît dans les résultats des tests réalisés à l'aide du Test Workbench.

Indicateurs de défaillance des créneaux de conversation : cet indicateur indique les 5 emplacements les moins performants du set de test. Indique le taux de réussite pour chaque emplacement dans l'intention. Le graphique à barres montre à la fois la transcription vocale et les end-to-end conversations pour chaque créneau indiqué dans l'intention.

Onglet Intention et résultats des machines à sous :

Le graphique des métriques de reconnaissance des intentions apparaît dans les résultats des tests à l'aide du Test Workbench.

Mesures de reconnaissance des intentions : affiche un tableau indiquant le nombre d'intentions reconnues avec succès. Affiche le taux de réussite de la transcription vocale et end-to-end des conversations.

Le graphique des métriques de résolution des emplacements apparaît dans les résultats des tests à l'aide du Test Workbench.

Mesures de résolution des créneaux : affiche les intentions et les créneaux séparément, ainsi que le taux de réussite et d'échec de chaque intervalle pour chaque intention utilisée dans la conversation ou dans une entrée unique. Affiche le taux de réussite de la transcription vocale et end-to-end des conversations.

Onglet des résultats détaillés :

Les résultats détaillés sont présentés dans les résultats des tests réalisés à l'aide du Test Workbench.

Résultats détaillés — Affiche un tableau détaillé sur le journal des conversations avec les énoncés de l'utilisateur et de l'agent, ainsi que le résultat attendu et la transcription attendue pour chaque intervalle. Vous pouvez télécharger ce rapport en cliquant sur le bouton Télécharger.

Le tableau suivant répertorie les messages d'erreur liés à l'échec des résultats avec des scénarios.

Scénario	Message d’erreur	Action
Incompatibilité d'intention	C'était BookFlight l'intention, mais c'était BookHotel l'intention.	Ignorer les autres tournants de la conversation
Incompatibilité entre les machines à sous Elicitation	Le créneau DepartureDate attendu devait être obtenu, mais il s'agissait de CabinType.	Ignorer les autres tournants de la conversation
Incompatibilité de la valeur du slot	Incompatibilité entre la valeur attendue et la valeur réelle de l'emplacement.	Poursuivez les conversations à d'autres reprises
Back-to-back l'invite de l'agent est manquante	On s'attendait à ce que le bot renvoie une invite à l'agent à ce tour, mais celle-ci n'a pas été reçue.	Ignorer les autres tournants de la conversation
Incompatibilité de transcription	La transcription attendue ne correspond pas à la transcription réelle.	Poursuivez les conversations à d'autres reprises
Emplacement optionnel non obtenu	On s'attend à obtenir le slot CabinType au prochain tour, mais l'intention actuelle a été remplie avant cela.	Ignorer les autres tournants de la conversation
Emplacement non reconnu	Le créneau Expected DepartureDate n'a pas été reconnu lors de ce tour.	Ignorer les autres tournants de la conversation
Demande d' back-to-backagent supplémentaire	Je m'attendais à un tour d'utilisateur mais c'était une demande de l'agent	Ignorer les autres tournants de la conversation

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Afficher les résultats du test

Diffusion de conversations sur votre robot Lex V2