Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Ejemplo de flujo de trabajo de búsqueda de altavoces
importante
La función de búsqueda de interlocutores implica la creación de una incrustación de voz, que se puede utilizar para comparar la voz de la persona que llama con los datos de voz almacenados anteriormente. La recopilación, el uso, el almacenamiento y la conservación de los identificadores biométricos y la información biométrica en forma de huella de voz digital pueden requerir el consentimiento informado de la persona que llama mediante una autorización por escrito. Diversas leyes estatales exigen dicho consentimiento, incluidas las leyes de biometría de Illinois, Texas y Washington y otras leyes estatales de privacidad. Antes de utilizar la característica de búsqueda de ponentes, debe proporcionar todos los avisos y obtener todos los consentimientos exigidos por la legislación aplicable y según las condiciones de servicio de AWS
En el siguiente diagrama se muestra un ejemplo de flujo de datos a través de una tarea de análisis de búsqueda de interlocutores. El texto numerado debajo de la imagen describe cada paso del proceso.
nota
En el diagrama se supone que ya ha configurado un conector de voz de Amazon Chime SDK con una configuración de análisis de llamadas que tiene un VoiceAnalyticsProcessor
. Para obtener más información, consulte Grabar llamadas de Voice Connector.
En el diagrama:
Usted o un administrador del sistema crean un dominio de perfiles de voz para almacenar las incrustaciones de voz y los perfiles de voz. Para obtener más información sobre la creación de dominios de perfiles de voz, consulte Creación de dominios de perfiles de voz en la Guía del administrador de Amazon Chime SDK. También puedes usar la CreateVoiceProfileDomainAPI.
Una persona llama con un número de teléfono asignado a un conector de voz de Amazon Chime SDK. O bien, un agente usa un número de Voice Connector para realizar una llamada saliente.
El servicio Amazon Chime SDK Voice Connector crea un identificador de transacción y lo asocia a la llamada.
Si la aplicación se suscribe a EventBridge los eventos, la aplicación llama a la CreateMediaInsightsPipelineAPI con la configuración de canalización de Media Insights y los ARN de Kinesis Video Stream para la llamada de Voice Connector.
Para obtener más información sobre el uso EventBridge, consulte. Flujos de trabajo para análisis basados en el machine learning
Su aplicación (por ejemplo, un sistema de respuesta de voz interactiva) o su agente notifican a la persona que llama sobre la grabación de llamadas y el uso de incrustaciones de voz para el análisis de la voz y solicita su consentimiento para participar.
Una vez que la persona que llama dé su consentimiento, tu aplicación o agente podrá llamar a la StartSpeakerSearchTaskAPI a través del SDK de voz si dispones de un conector de voz y un identificador de transacción. O bien, si tienes un ID de canalización de Media Insights en lugar de un ID de transacción, llamas a la StartSpeakerSearchTaskAPI en el SDK de Media Pipelines.
Una vez que la persona que llama dé su consentimiento, su aplicación o agente llamará a la API de
StartSpeakerSearchTask
. Debe pasar el ID del conector de voz, el ID de transacción y el ID de dominio del perfil de voz a la API. Se devuelve un identificador de tarea de búsqueda de hablantes para identificar la tarea asincrónica.nota
Antes de invocar la API de
StartSpeakerSearchTask
en cualquiera de los SDK, debe proporcionar las notificaciones necesarias y obtener los consentimientos necesarios, según lo exige la ley y las condiciones de servicio de AWS. El sistema acumula 10 segundos de la voz de la persona que llama. La persona que llama debe hablar durante al menos ese tiempo. El sistema no captura ni analiza el silencio.
El canal de información multimedia compara la voz con los perfiles de voz del dominio y enumera las 10 coincidencias con mayor confianza. Si no encuentra ninguna coincidencia, el Voice Connector crea un perfil de voz.
El servicio de canalización de información multimedia envía un evento de notificación a los destinos de notificación configurados.
La persona que llama sigue hablando y proporciona 10 segundos adicionales de voz sin silencio.
El canal de información multimedia genera una función de registro de voz integrada que se puede utilizar para crear un perfil de voz o actualizar un perfil de voz existente.
El canal de información multimedia envía una notificación de
VoiceprintGenerationSuccessful
a los destinatarios de notificaciones configurados.-
La aplicación llama a las CreateVoiceProfileUpdateVoiceProfileAPI para crear o actualizar el perfil.
La aplicación llama a la GetSpeakerSearchTaskAPI según sea necesario para obtener el estado más reciente de la tarea de búsqueda de altavoces.