샘플 음성 톤 분석 워크플로 - Amazon Chime SDK

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

샘플 음성 톤 분석 워크플로

중요

음성 톤 분석에는 언어 및 음조 정보를 기반으로 화자의 감정을 예측하는 작업이 포함됩니다. 개인에게 법적 또는 유사하게 중대한 영향을 미칠 수 있는 개인에 대한 결정을 내리는 경우(예: 고용, 주택, 신용 등급 또는 금융 제안 등과 관련하여)를 포함하여 법률에서 금지하는 방식으로는 감정 분석을 사용해서는 안 됩니다.

음성 톤 분석은 통화 중인 사람들의 목소리를 분석하고 그들의 감정(positive, negative, 또는 neutral)을 예측합니다.

다음 다이어그램은 음성 톤 분석을 위한 워크플로의 예를 보여 줍니다. 이미지 아래의 번호가 매겨진 항목은 프로세스의 각 단계를 설명합니다.

참고

이 다이어그램에서는 이미 VoiceAnalyticsProcessor가 있는 통화 분석 구성으로 Amazon Chime SDK 음성 커넥터를 구성했다고 가정합니다. 자세한 정보는 음성 커넥터 통화 레코딩을 참조하세요.

음성 톤 분석을 통한 데이터 흐름을 보여주는 다이어그램입니다.

다이어그램에서

  1. 발신자는 Amazon Chime SDK 음성 커넥터에 할당된 전화번호를 사용하여 전화를 겁니다. 또는 상담원이 음성 커넥터 번호를 사용하여 아웃바운드 전화를 걸 수도 있습니다.

  2. 음성 커넥터 서비스는 트랜잭션 ID를 생성하여 통화와 연결합니다.

  3. 대화형 음성 응답 시스템과 같은 애플리케이션 또는 상담원은 발신자에게 통화 레코딩 및 음성 분석을 위한 음성 임베딩 사용에 대해 고지하고 참여에 대한 동의를 구합니다.

  4. 애플리케이션이 EventBridge 이벤트를 구독한다고 가정하면, 애플리케이션은 미디어 인사이트 파이프라인 구성 및 음성 커넥터 호출을 위한 Kinesis Video Stream ARN을 사용하여 CreateMediaInsightsPipelineAPI를 호출합니다.

    사용에 EventBridge 대한 자세한 내용은 을 참조하십시오. 기계 학습 기반 분석을 위한 워크플로

  5. 발신자가 동의하면 음성 커넥터와 트랜잭션 ID가 있는 경우 애플리케이션 또는 에이전트가 Voice SDK를 통해 StartSpeakerSearchTaskAPI를 호출할 수 있습니다. 또는 트랜잭션 ID 대신 미디어 인사이트 파이프라인 ID가 있는 경우 미디어 파이프라인 SDK에서 StartSpeakerSearchTaskAPI를 호출합니다.

    발신자가 동의를 제공하면 애플리케이션 또는 상담원이 StartSpeakerSearchTask API를 호출합니다. 음성 커넥터 ID, 트랜잭션 ID 및 음성 프로필 도메인 ID를 API에 전달해야 합니다. 비동기 작업을 식별하기 위해 화자 검색 작업 ID가 반환됩니다.

  6. 사용자는 통화 내내 말을 합니다.

  7. 상담원은 통화 내내 말을 합니다.

  8. 미디어 인사이트 파이프라인은 5초마다 기계 학습 모델을 사용하여 마지막 30초 간의 음성을 분석하고 해당 인터벌, 그리고 StartVoiceToneAnalysisTask가 처음 호출된 시점부터 전체 통화에 대한 발신자의 어조를 예측합니다.

  9. 미디어 인사이트 파이프라인은 해당 정보가 포함된 알림을 구성된 알림 대상에 보냅니다. 스트림 ARN 및 채널 ID를 기반으로 알림을 식별할 수 있습니다. 자세한 내용은 이 섹션 뒷부분의 알림에 대한 이해 항목을 참조하세요.

  10. 통화가 종료될 때까지 9단계와 10단계를 반복합니다.

  11. 통화가 끝나면 미디어 인사이트 파이프라인은 지난 30초 동안의 현재 평균 톤 예측치에 전체 통화의 평균 톤을 더한 최종 알림 하나를 보냅니다.

  12. 애플리케이션은 필요에 따라 GetVoiceToneAnalysisTaskAPI를 호출하여 음성 톤 분석 작업의 최신 상태를 가져옵니다.

    참고

    GetVoiceToneAnalysisTask API는 톤 데이터를 스트리밍하지 않습니다.

참고

GetVoiceToneAnalysisTaskAPI는 음성 톤 데이터를 반환하지 않습니다.