Détails des résultats des tests - Amazon Lex

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Détails des résultats des tests

Les résultats du test indiquent les détails du set de test, les intentions utilisées et les emplacements utilisés. Il fournit également la répartition globale des entrées du set de tests, y compris les résultats globaux, les résultats des conversations, l'intention et les résultats des créneaux.

Les résultats des tests comprennent toutes les informations relatives aux tests, telles que :

  • Métadonnées des détails du test

  • Résultats globaux

  • Résultats des conversations

  • Intention et résultats des créneaux

  • Résultats détaillés

Onglet des résultats globaux :

Le tableau de répartition des entrées du set de test dans les résultats des tests à l'aide du Test Workbench.

Répartition des entrées du set de test — Ce graphique montre la répartition du nombre de conversations et d'énoncés à entrée unique dans le set de test.

Le graphique de répartition à entrée unique dans les résultats de test à l'aide du Test Workbench.

Répartition par entrée unique : affiche deux graphiques qui incluent end-to-end les conversations et les transcriptions vocales. Le nombre d'entrées réussies et échouées est indiqué sur chaque graphique. Remarque : le tableau de transcription vocale ne sera visible que pour le set de test audio.

Le diagramme de répartition des conversations dans les résultats des tests à l'aide du Test Workbench.

Répartition des conversations : affiche deux graphiques qui incluent end-to-end les conversations et les transcriptions vocales. Le nombre d'entrées réussies et échouées est indiqué sur chaque graphique. Remarque : le tableau de transcription vocale ne sera visible que pour le set de test audio.

Onglet des résultats de conversation :

Le graphique des taux de réussite des conversations apparaît dans les résultats des tests réalisés à l'aide du Test Workbench.

Taux de réussite des conversations : le tableau des taux de réussite des conversations est utilisé pour voir quelles intentions et quels créneaux sont utilisés dans chaque conversation du set de test. Vous pouvez visualiser où la conversation a échoué en examinant quelle intention ou quel créneau a échoué, ainsi que le pourcentage de réussite de chaque intention et de chaque créneau.

Le graphique des indicateurs d'échec de l'intention de conversation apparaît dans les résultats des tests à l'aide du Test Workbench.

Indicateurs d'échec des intentions de conversation : cet indicateur indique les 5 intentions les moins performantes de l'ensemble de tests. Ce panneau affiche un graphique indiquant le pourcentage ou le nombre d'tentatives réussies ou échouées sur la base des journaux de conversation ou de la transcription du bot. Une intention réussie ne signifie pas que l'ensemble de la conversation a été couronné de succès. Ces mesures ne s'appliquent qu'à la valeur des intentions, quelle que soit l'intention antérieure ou ultérieure.

Le graphique des indicateurs de défaillance des emplacements de conversation apparaît dans les résultats des tests réalisés à l'aide du Test Workbench.

Indicateurs de défaillance des créneaux de conversation : cet indicateur indique les 5 emplacements les moins performants du set de test. Indique le taux de réussite pour chaque emplacement dans l'intention. Le graphique à barres montre à la fois la transcription vocale et les end-to-end conversations pour chaque créneau indiqué dans l'intention.

Onglet Intention et résultats des créneaux :

Le graphique des métriques de reconnaissance des intentions apparaît dans les résultats des tests à l'aide du Test Workbench.

Mesures de reconnaissance des intentions : affiche un tableau indiquant le nombre d'intentions reconnues avec succès. Affiche le taux de réussite de la transcription vocale et end-to-end des conversations.

Le graphique des métriques de résolution des emplacements apparaît dans les résultats des tests à l'aide du Test Workbench.

Mesures de résolution des créneaux : affiche les intentions et les créneaux séparément, ainsi que le taux de réussite et d'échec de chaque intervalle pour chaque intention utilisée dans la conversation ou dans une entrée unique. Affiche le taux de réussite de la transcription vocale et end-to-end des conversations.

Onglet des résultats détaillés :

Les résultats détaillés sont présentés dans les résultats des tests réalisés à l'aide du Test Workbench.

Résultats détaillés — Affiche un tableau détaillé sur le journal des conversations avec les énoncés de l'utilisateur et de l'agent, ainsi que le résultat attendu et la transcription attendue pour chaque intervalle. Vous pouvez télécharger ce rapport en cliquant sur le bouton Télécharger.

Le tableau suivant répertorie les messages d'erreur liés à l'échec des résultats avec des scénarios.

Scénario Message d’erreur Action
Incompatibilité d'intention BookFlight Intention attendue, mais c'était BookHotel une intention.

Ignorer les autres tournants de la conversation

Incompatibilité entre les machines à sous Elicitation Le créneau DepartureDate attendu devait être obtenu, mais il s'agissait de CabinType. Ignorer les autres tournants de la conversation
Incompatibilité de la valeur du slot Incompatibilité entre la valeur attendue et la valeur réelle de l'emplacement. Poursuivez les conversations à d'autres reprises
ack-to-back L'invite de l'agent B est manquante On s'attendait à ce que le bot renvoie une invite à l'agent à ce tour, mais celle-ci n'a pas été reçue. Ignorer les autres tournants de la conversation
Incompatibilité de transcription La transcription attendue ne correspond pas à la transcription réelle. Poursuivez les conversations à d'autres reprises
Emplacement optionnel non obtenu On s'attend à obtenir le slot CabinType au prochain tour, mais l'intention actuelle a été remplie avant cela. Ignorer les autres tournants de la conversation
Emplacement non reconnu Le créneau Expected DepartureDate n'a pas été reconnu lors de ce tour. Ignorer les autres tournants de la conversation
Demande d' back-to-back agent supplémentaire Je m'attendais à un tour d'utilisateur mais c'était une demande de l'agent Ignorer les autres tournants de la conversation