Arquitetura de análise de voz - SDK do Amazon Chime

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Arquitetura de análise de voz

Os tópicos desta seção fornecem uma visão geral da arquitetura de análise de voz do SDK do Amazon Chime, incluindo os fluxos de dados de cada atributo.

Este diagrama fornece uma visualização de alto nível de como os dados fluem por meio da análise de voz.

Um diagrama mostrando o fluxo de dados de alto nível por meio da análise de voz.

No diagrama:

  1. O áudio é transferido para um stream de vídeo do Kinesis para um chamador e um atendente. Você pode usar um produtor do stream de vídeo do Kinesiss ou o streaming do conector de voz do SDK do Amazon Chime para fazer isso. Para obter mais informações, consulte Fluxos de trabalho para análises baseadas em machine learning neste guia e Streaming de mídia do conector de voz do SDK do Amazon Chime para Kinesis no Guia do administrador do SDK do Amazon Chime.

  2. Um aplicativo ou um compilador aciona a pesquisa de locutores, a análise do tom de voz, ou ambas, para o fluxo de áudio após o consentimento do chamador.

  3. Durante a chamada, a análise de voz envia notificações para um destino, que pode ser o Amazon Simple Queue Service (SQS), Amazon Simple Notification Service (SNS), AWS Lambda ou Amazon Kinesis Data Streams.

Além disso, a análise de voz fornece essas ferramentas para gerenciar os dados que ela gera.

Perfis de voz

A combinação de uma incorporação de voz, o ID exclusivo incorporado e sua data de expiração. Os perfis de voz expiram após três anos por motivos de segurança e porque as vozes mudam com o tempo. Para evitar a recriação de perfis de voz, chame a UpdateVoiceProfileAPI. Para obter mais informações sobre datas de expiração, consulte Retenção de dados.

Para registrar uma incorporação de voz ou atualizar uma incorporação de voz registrada, você deve chamar as UpdateVoiceProfileAPIs CreateVoiceProfileou dentro de 24 horas após o término da chamada.

Domínios de perfil de voz

Uma coleção de perfis de voz.