Descripción de los flujos de trabajo de búsqueda de hablantes de Amazon Chime SDK

En esta sección, le mostramos un ejemplo de flujo de datos y programas para un análisis de búsqueda de hablantes de Amazon Chime SDK.

La función de búsqueda de interlocutores implica la creación de una incrustación de voz, que se puede utilizar para comparar la voz de la persona que llama con los datos de voz almacenados anteriormente. La recopilación, el uso, el almacenamiento y la conservación de los identificadores biométricos y la información biométrica en forma de huella de voz digital pueden requerir el consentimiento informado de la persona que llama mediante una autorización por escrito. Diversas leyes estatales exigen dicho consentimiento, incluidas las leyes de biometría de Illinois, Texas y Washington y otras leyes estatales de privacidad. Antes de utilizar la característica de búsqueda de ponentes, debe proporcionar todos los avisos y obtener todos los consentimientos exigidos por la legislación aplicable y según las condiciones de servicio de AWS que rigen el uso de la función.

En el siguiente diagrama se muestra un ejemplo de flujo de datos a través de una tarea de análisis de búsqueda de interlocutores. Las descripciones numeradas que aparecen debajo del diagrama explican cada paso del proceso. En el diagrama se supone que ya ha configurado un conector de voz de Amazon Chime SDK con una configuración de análisis de llamadas que tiene un VoiceAnalyticsProcessor. Para obtener más información, consulte Grabar llamadas de Voice Connector.

Un diagrama que muestra el flujo de datos a través de un análisis de búsqueda de interlocutores.

Usted o un administrador del sistema crean un dominio de perfiles de voz para almacenar las incrustaciones de voz y los perfiles de voz. Para obtener más información sobre la creación de dominios de perfiles de voz, consulte Creación de dominios de perfiles de voz en la Guía del administrador de Amazon Chime SDK. También puede utilizar la CreateVoiceProfileDomainAPI.
Una persona llama con un número de teléfono asignado a un conector de voz de Amazon Chime SDK. O bien, un agente usa un número de Voice Connector para realizar una llamada saliente.
El servicio Amazon Chime SDK Voice Connector crea un identificador de transacción y lo asocia a la llamada.
Si la aplicación se suscribe a EventBridge los eventos, la aplicación llama a la CreateMediaInsightsPipelineAPI con la configuración de canalización de Media Insights y Kinesis Video Stream ARNs para la llamada de Voice Connector.

Para obtener más información sobre su uso EventBridge, consulte. Descripción de los flujos de trabajo de las analíticas basadas en el machine learning para el Amazon Chime SDK
Su aplicación (por ejemplo, un sistema de respuesta de voz interactiva) o su agente notifican a la persona que llama sobre la grabación de llamadas y el uso de incrustaciones de voz para el análisis de la voz y solicita su consentimiento para participar.
Una vez que la persona que llama dé su consentimiento, su solicitud o agente pueden llamar al StartSpeakerSearchTaskUtilice la API a través del SDK de voz si tiene un conector de voz y un identificador de transacción. O bien, si tienes un identificador de canalización de Media Insights en lugar de un identificador de transacción, llamas al StartSpeakerSearchTaskAPI en el SDK de Media Pipelines.

Una vez que la persona que llama dé su consentimiento, su aplicación o agente llamará a la API StartSpeakerSearchTask. Debe pasar el ID del conector de voz, el ID de transacción y el ID de dominio del perfil de voz a la API. Se devuelve un identificador de tarea de búsqueda de hablantes para identificar la tarea asincrónica.

nota
Antes de invocar la StartSpeakerSearchTask API en cualquiera de los dos SDKs, debe proporcionar las notificaciones necesarias y obtener los consentimientos necesarios, según lo exige la ley y las condiciones de servicio de AWS.
El sistema acumula 10 segundos de la voz de la persona que llama. La persona que llama debe hablar durante al menos ese tiempo. El sistema no captura ni analiza el silencio.
El canal de información multimedia compara la voz con los perfiles de voz del dominio y enumera las 10 coincidencias con mayor confianza. Si no encuentra ninguna coincidencia, el Voice Connector crea un perfil de voz.
El servicio de canalización de información multimedia envía un evento de notificación a los destinos de notificación configurados.
La persona que llama sigue hablando y proporciona 10 segundos adicionales de voz sin silencio.
El canal de información multimedia genera una función de registro de voz integrada que se puede utilizar para crear un perfil de voz o actualizar un perfil de voz existente.
El canal de información multimedia envía una notificación de VoiceprintGenerationSuccessful a los destinatarios de notificaciones configurados.
Su aplicación llama al CreateVoiceProfile o UpdateVoiceProfile APIs para crear o actualizar el perfil.
Su aplicación llama al GetSpeakerSearchTaskUtilice la API necesaria para obtener el estado más reciente de la tarea de búsqueda de altavoces.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Descripción de la arquitectura de análisis de voz

Ejemplo de flujo de trabajo de análisis de tonos de voz

Descripción de los flujos de trabajo de búsqueda de hablantes de Amazon Chime SDK

nota