在本节中,我们会展示 Amazon Chime SDK 发言人搜索分析的示例数据和程序流。
发言人搜索功能涉及创建语音嵌入,该嵌入可用于比较呼叫者的语音与先前存储的语音数据。以数字声纹的形式收集、使用、存储和保留生物识别标识符和生物识别信息,可能需要以书面形式获得呼叫者的知情同意。根据各种州法律,包括伊利诺伊州、德克萨斯州、华盛顿州的生物识别法和其他州的隐私法,都要求获得此类同意。在使用发言人搜索功能之前,您必须根据适用法律以及监督您使用该功能的 AWS 服务条款
下图显示了通过发言人搜索分析任务的数据流示例。图下方的带编号的描述介绍了该过程的每个步骤。该图假设您已经使用具有 VoiceAnalyticsProcessor
的呼叫分析配置来配置了 Amazon Chime SDK 语音连接器。有关更多信息,请参阅 录制 Voice Connector 通话。
-
您或系统管理员创建一个语音配置文件域,用于存储语音嵌入和语音配置文件。有关创建语音配置文件域的更多信息,请参阅 Amazon Chime SDK 管理员指南中的创建语音配置文件域。您也可以使用 CreateVoiceProfileDomain API。
-
呼叫者使用分配给 Amazon Chime SDK 语音连接器的电话号码拨号。或者,座席使用语音连接器号码执行出站呼叫。
-
Amazon Chime SDK 语音连接器服务会创建一个事务 ID 并将其与呼叫关联。
-
如果您的应用订阅了 EventBridge 事件,则其会使用适用于语音连接器呼叫的媒体见解管线配置和 Kinesis 视频流 ARN 来调用 CreateMediaInsightsPipeline API。
有关使用 EventBridge 的更多信息,请参考 了解 Amazon Chime SDK 基于机器学习的分析工作流程。
-
您的应用程序(例如交互式语音应答系统)或座席会向呼叫者提供有关呼叫记录和使用语音嵌入进行语音分析的通知,并征得他们的同意才能参与。
-
一旦呼叫者表示同意,如果您具有语音连接器和事务 ID,您的应用程序或座席就可以通过语音 SDK 来调用 StartSpeakerSearchTask API。或者,如果您具有媒体见解管线 ID 而不是事务 ID,则可以在媒体管道 SDK 中调用 StartSpeakerSearchTask API。
一旦呼叫者表示同意,您的应用程序或座席就会调用
StartSpeakerSearchTask
API。您必须将语音连接器 ID、事务 ID 和语音配置文件域 ID 传递给 API。返回发言人搜索任务 ID 以识别异步任务。注意
在两个 SDK 之一中调用
StartSpeakerSearchTask
API 之前,您必须根据法律和 AWS 服务条款的要求提供所有必要的通知并获得必要的同意。 -
系统会累积 10 秒钟的呼叫者语音。呼叫者必须至少在这段时间内说话。系统不会捕获或分析静默。
-
媒体见解管线比较话音与域中的语音配置文件,并列出置信度最高的十个匹配项。如果找不到匹配项,语音连接器就会创建语音配置文件。
-
媒体见解管线服务向配置的通知目标发送通知事件。
-
呼叫者继续说话,并额外提供 10 秒钟的非静默话音。
-
媒体见解管线生成注册语音嵌入,您可用于创建语音配置文件或更新现有语音配置文件。
-
媒体见解管线向配置的通知目标发送
VoiceprintGenerationSuccessful
通知。 -
您的应用程序会调用 CreateVoiceProfile 或 UpdateVoiceProfile API 来创建或更新配置文件。
-
您的应用程序会根据需要调用 GetSpeakerSearchTask API 来获取发言人搜索任务的最新状态。