Amazon Chime SDK의 샘플 음성 톤 분석 워크플로

중요

음성 톤 분석에는 언어 및 음조 정보를 기반으로 화자의 감정을 예측하는 작업이 포함됩니다. 개인에게 법적 또는 유사하게 중대한 영향을 미칠 수 있는 개인에 대한 결정을 내리는 경우(예: 고용, 주택, 신용 등급 또는 금융 제안 등과 관련하여)를 포함하여 법률에서 금지하는 방식으로는 감정 분석을 사용해서는 안 됩니다.

음성 톤 분석은 통화 중인 사람들의 목소리를 분석하고 그들의 감정(positive, negative, 또는 neutral)을 예측합니다.

다음 다이어그램은 음성 톤 분석을 위한 워크플로의 예를 보여 줍니다. 이미지 아래의 번호가 매겨진 항목은 프로세스의 각 단계를 설명합니다.

참고

이 다이어그램에서는 이미 VoiceAnalyticsProcessor가 있는 통화 분석 구성으로 Amazon Chime SDK 음성 커넥터를 구성했다고 가정합니다. 자세한 내용은 음성 커넥터 통화 레코딩 단원을 참조하십시오.

다이어그램에서

발신자는 Amazon Chime SDK 음성 커넥터에 할당된 전화번호를 사용하여 전화를 겁니다. 또는 상담원이 음성 커넥터 번호를 사용하여 아웃바운드 전화를 걸 수도 있습니다.
음성 커넥터 서비스는 트랜잭션 ID를 생성하여 통화와 연결합니다.
대화형 음성 응답 시스템과 같은 애플리케이션 또는 상담원은 발신자에게 통화 레코딩 및 음성 분석을 위한 음성 임베딩 사용에 대해 고지하고 참여에 대한 동의를 구합니다.
애플리케이션이 EventBridge 이벤트를 구독한다고 가정하면 애플리케이션은 미디어 인사이트 파이프라인 구성을 사용하여 CreateMediaInsightsPipeline API를 직접 호출하고 음성 커넥터 호출을 위한 Kinesis Video Stream ARN을 직접 호출합니다.

EventBridge 사용에 대한 자세한 내용은 Amazon Chime SDK의 기계 학습 기반 분석을 위한 워크플로 이해 섹션을 참조하세요.
발신자가 동의를 제공하면 음성 커넥터와 트랜잭션 ID가 있는 경우 애플리케이션이나 상담원이 음성 SDK를 통해 StartSpeakerSearchTask API를 직접 호출할 수 있습니다. 또는 트랜잭션 ID 대신 미디어 인사이트 파이프라인 ID가 있는 경우 미디어 파이프라인 SDK에서 StartSpeakerSearchTask API를 직접 호출합니다.

발신자가 동의를 제공하면 애플리케이션 또는 상담원이 StartSpeakerSearchTask API를 호출합니다. 음성 커넥터 ID, 트랜잭션 ID 및 음성 프로필 도메인 ID를 API에 전달해야 합니다. 비동기 작업을 식별하기 위해 화자 검색 작업 ID가 반환됩니다.
사용자는 통화 내내 말을 합니다.
상담원은 통화 내내 말을 합니다.
미디어 인사이트 파이프라인은 5초마다 기계 학습 모델을 사용하여 마지막 30초 간의 음성을 분석하고 해당 인터벌, 그리고 StartVoiceToneAnalysisTask가 처음 호출된 시점부터 전체 통화에 대한 발신자의 어조를 예측합니다.
미디어 인사이트 파이프라인은 해당 정보가 포함된 알림을 구성된 알림 대상에 보냅니다. 스트림 ARN 및 채널 ID를 기반으로 알림을 식별할 수 있습니다. 자세한 내용은 이 섹션 뒷부분의 Amazon Chime SDK의 알림 이해 항목을 참조하세요.
통화가 종료될 때까지 9단계와 10단계를 반복합니다.
통화가 끝나면 미디어 인사이트 파이프라인은 지난 30초 동안의 현재 평균 톤 예측치에 전체 통화의 평균 톤을 더한 최종 알림 하나를 보냅니다.
애플리케이션에서 필요에 따라 GetVoiceToneAnalysisTask API를 직접 호출하여 음성 톤 분석 작업의 최신 상태를 가져옵니다.

참고
GetVoiceToneAnalysisTask API는 톤 데이터를 스트리밍하지 않습니다.

참고

GetVoiceToneAnalysisTask API는 음성 톤 데이터를 반환하지 않습니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

화자 검색 워크플로 이해

작업 결과 폴링