Ejemplo de flujo de trabajo de búsqueda de altavoces - Amazon Chime SDK

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ejemplo de flujo de trabajo de búsqueda de altavoces

importante

La función de búsqueda de interlocutores implica la creación de una incrustación de voz, que se puede utilizar para comparar la voz de la persona que llama con los datos de voz almacenados anteriormente. La recopilación, el uso, el almacenamiento y la conservación de los identificadores biométricos y la información biométrica en forma de huella de voz digital pueden requerir el consentimiento informado de la persona que llama mediante una autorización por escrito. Diversas leyes estatales exigen dicho consentimiento, incluidas las leyes de biometría de Illinois, Texas y Washington y otras leyes estatales de privacidad. Antes de utilizar la función de búsqueda de altavoces, debe proporcionar todos los avisos y obtener todos los consentimientos exigidos por la legislación aplicable y según las condiciones de AWS servicio que rigen el uso de la función.

En el siguiente diagrama se muestra un ejemplo de flujo de datos a través de una tarea de análisis de búsqueda de interlocutores. El texto numerado debajo de la imagen describe cada paso del proceso.

nota

En el diagrama se supone que ya ha configurado un conector de SDK voz de Amazon Chime con una configuración de análisis de llamadas que tiene un. VoiceAnalyticsProcessor Para obtener más información, consulte Grabar llamadas de Voice Connector.

Un diagrama que muestra el flujo de datos a través de un análisis de búsqueda de interlocutores.

En el diagrama:

  1. Usted o un administrador del sistema crean un dominio de perfiles de voz para almacenar las incrustaciones de voz y los perfiles de voz. Para obtener más información sobre la creación de dominios de perfiles de voz, consulte Creación de dominios de perfiles de voz en la Guía del SDKadministrador de Amazon Chime. También puede utilizar la CreateVoiceProfileDomain API.

  2. La persona que llama llama con un número de teléfono asignado a un conector de voz de Amazon SDK Chime. O bien, un agente usa un número de Voice Connector para realizar una llamada saliente.

  3. El servicio Amazon Chime SDK Voice Connector crea un identificador de transacción y lo asocia a la llamada.

  4. Si la aplicación se suscribe a los EventBridge eventos, la aplicación llama al CreateMediaInsightsPipelineAPIcon la configuración de canalización de Media Insights y Kinesis Video Stream ARNs para la llamada de Voice Connector.

    Para obtener más información sobre el uso EventBridge, consulte. Descripción de los flujos de trabajo para el análisis basado en el aprendizaje automático

  5. Su aplicación (por ejemplo, un sistema de respuesta de voz interactiva) o su agente notifican a la persona que llama sobre la grabación de llamadas y el uso de incrustaciones de voz para el análisis de la voz y solicita su consentimiento para participar.

  6. Una vez que la persona que llama dé su consentimiento, su solicitud o agente pueden llamar al StartSpeakerSearchTaskAPIa través de la voz SDK si tienes un conector de voz y un identificador de transacción. O bien, si tienes un identificador de canalización de Media Insights en lugar de un identificador de transacción, llamas al StartSpeakerSearchTaskAPIen los canales de Media. SDK

    Una vez que la persona que llama dé su consentimiento, su solicitud o agente llamará al. StartSpeakerSearchTask API Debe pasar el ID del conector de voz, el ID de transacción y el ID de dominio del perfil de voz alAPI. Se devuelve un identificador de tarea de búsqueda de hablantes para identificar la tarea asincrónica.

    nota

    Antes de invocarlos StartSpeakerSearchTask API en cualquiera de los dosSDKs, debe proporcionar las notificaciones necesarias y obtener los consentimientos necesarios, según lo exijan la ley y las condiciones del AWSservicio.

  7. El sistema acumula 10 segundos de la voz de la persona que llama. La persona que llama debe hablar durante al menos ese tiempo. El sistema no captura ni analiza el silencio.

  8. El canal de información multimedia compara la voz con los perfiles de voz del dominio y enumera las 10 coincidencias con mayor confianza. Si no encuentra ninguna coincidencia, el Voice Connector crea un perfil de voz.

  9. El servicio de canalización de información multimedia envía un evento de notificación a los destinos de notificación configurados.

  10. La persona que llama sigue hablando y proporciona 10 segundos adicionales de voz sin silencio.

  11. El canal de información multimedia genera una función de registro de voz integrada que se puede utilizar para crear un perfil de voz o actualizar un perfil de voz existente.

  12. El canal de información multimedia envía una notificación de VoiceprintGenerationSuccessful a los destinatarios de notificaciones configurados.

  13. Su solicitud llama al CreateVoiceProfile o UpdateVoiceProfileAPIspara crear o actualizar el perfil.

  14. Su aplicación llama al GetSpeakerSearchTaskAPIsegún sea necesario para obtener el estado más reciente de la tarea de búsqueda de altavoces.