語音調分析工作流程範例 - Amazon Chime SDK

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

語音調分析工作流程範例

重要

語調分析包括根據語言和色調信息對演講者的情緒進行預測。您不得以任何法律禁止的方式使用情緒分析,包括就個人作出決定,這些決定會對此類個人產生法律或類似重大影響(例如,與僱傭、住房、信貸可靠性或財務要約等有關)。

語音分析會分析人員在通話中的聲音,並預測他們的情緒,無論是positivenegative、或neutral

下圖顯示語調分析的範例工作流程。圖像下方的編號項目描述了流程的每個步驟。

注意

此圖表假設您已設定 Amazon Chime SDK 語音連接器,其中的呼叫分析組態具有. VoiceAnalyticsProcessor 如需詳細資訊,請參閱 錄製語音連接器通話

顯示通過語調分析的數據流的圖表。

在圖中:

  1. 來電者使用指派給 Amazon Chime SDK 語音連接器的電話號碼撥號。或者,代理程式會使用語音連接器號碼撥出電話。

  2. 語音連接器服務會建立交易 ID,並將其與通話產生關聯。

  3. 您的應用程式 (例如互動式語音回應系統) 或代理程式會向來電者提供有關通話錄音和使用語音嵌入進行語音分析的通知,並徵求他們同意參與。

  4. 假設您的應用程式訂閱了 EventBridge 事件,您的應用程式會使用媒體洞察管線組態和 Kinesis Video Stream ARN 來呼叫語音連接器呼叫的 CreateMediaInsightsPipelineAPI。

    如需使用的詳細資訊 EventBridge,請參閱基於機器學習的分析工作流程

  5. 來電者同意後,如果您有語音連接器和交易 ID,您的應用程式或代理程式就可以透過語音 SDK 呼叫 StartSpeakerSearchTaskAPI。或者,如果您擁有媒體見解管道 ID 而不是交易 ID,則可以在媒體管道 SDK 中呼叫 StartSpeakerSearchTaskAPI。

    一旦來電者提供同意,您的應用程式或代理會呼叫 StartSpeakerSearchTask API。您必須將語音連接器 ID、交易 ID 和語音設定檔網域識別碼傳遞至 API。傳回發言人搜尋工作 ID 以識別非同步工作。

  6. 用戶在整個通話中說話。

  7. 代理在整個通話中說話。

  8. 媒體見解管道每隔 5 秒就會使用機器學習模型來分析最後 30 秒的語音,並預測該間隔內呼叫者的音調,以及從第一次呼StartVoiceToneAnalysisTask叫起的整個通話。

  9. 媒體見解管道會將包含該資訊的通知傳送至設定的通知目標。您可以根據其串流 ARN 和通道識別碼來識別通知。如需詳細資訊,請參了解通知閱本節稍後的〈〉。

  10. 重複步驟 9 和 10,直到通話結束為止。

  11. 在通話結束時,媒體見解管道會傳送一個最終通知,其中包含最近 30 秒的目前平均音調預測,以及整個通話的平均音調。

  12. 您的應用程式會視需要呼叫 GetVoiceToneAnalysisTaskAPI,以取得語音音調分析工作的最新狀態。

    注意

    GetVoiceToneAnalysisTaskAPI 不會串流音調資料。

注意

GetVoiceToneAnalysisTaskAPI 不會傳回語音資料。