Uso de la transcripción en directo de Amazon Chime Amazon Chime SDK - Amazon Chime SDK

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de la transcripción en directo de Amazon Chime Amazon Chime SDK

Utilice la transcripción en directo de Amazon Chime SDK para generar transcripciones en directo de sus reuniones atribuidas a los usuarios. La transcripción en directo de Amazon Chime SDK se integra con los servicios Amazon Transcribe y Amazon Transcribe Medical para generar transcripciones de las reuniones de Amazon Chime SDK mientras están en curso.

La transcripción en directo de Amazon Chime SDK procesa el audio de cada usuario por separado para mejorar la precisión en escenarios con varios altavoces. Amazon Chime SDK utiliza su algoritmo de altavoz activo para seleccionar los dos principales usuarios activos y, a continuación, envía su audio a Amazon Transcribe, en canales separados, mediante una sola transmisión. Los participantes de la reunión reciben transcripciones atribuidas a los usuarios a través de mensajes de datos de Amazon Chime SDK. Puede usar las transcripciones de diversas maneras, como mostrar subtítulos, crear transcripciones de reuniones o usar las transcripciones para analizar el contenido.

La transcripción en directo utiliza una transmisión para Amazon Transcribe durante la transcripción de la reunión. Se aplican las tarifas estándar de Amazon Transcribe y Amazon Transcribe Medical. Para obtener más información, consulte los precios de Amazon Transcribe. Si tienes preguntas sobre el uso o la facturación, ponte en contacto con tu administrador de AWS cuentas.

importante

De forma predeterminada, Amazon Transcribe puede usar y almacenar contenido de audio procesado por el servicio para desarrollar y mejorar los servicios de AWS inteligencia artificial y aprendizaje automático, tal como se describe con más detalle en la sección 50 de las Condiciones del servicio.AWS El uso de Amazon Transcribe puede estar sujeto a las leyes o reglamentos federales y estatales relacionados con la grabación o la interceptación de comunicaciones electrónicas. Es su responsabilidad y la de los usuarios finales cumplir con todas las leyes aplicables en relación con la grabación, incluida la notificación adecuada a todos los participantes de una sesión o comunicación grabada de que la sesión o la comunicación se está grabando y obtener todos los consentimientos necesarios. Puede optar por no AWS usar contenido de audio para desarrollar y mejorar los servicios de AWS IA/ML configurando una política de exclusión de los servicios de IA mediante Organizations AWS .

Arquitectura del sistema

Amazon Chime SDK crea transcripciones de reuniones en tiempo real, sin que el audio salga de la red de AWS , mediante una integración del lado del servicio con su cuenta de Amazon Transcribe o Amazon Transcribe Medical. Para mejorar la precisión, el audio de los usuarios se procesa por separado y luego se mezcla en la reunión. Amazon Chime SDK utiliza su algoritmo de altavoz activo para seleccionar los dos altavoces más activos y, a continuación, envía su audio a Amazon Transcribe o Amazon Transcribe Medical en canales separados mediante una sola transmisión. Para reducir la latencia, las transcripciones atribuidas a los usuarios se envían directamente a todos los participantes de la reunión mediante mensajes de datos. Cuando se utiliza una canalización de medios para capturar el audio de la reunión, también se captura la información de transcripción de la reunión.

Un diagrama que muestra el flujo de datos de la transcripción de la reunión.

Facturación y uso

La transcripción en directo utiliza una transmisión a Amazon Transcribe o Amazon Transcribe Medical durante la transcripción de la reunión. Se aplican las tarifas estándar de Amazon Transcribe y Amazon Transcribe Medical. Para obtener más información, consulte Precios de Amazon Transcribe. Si tienes preguntas sobre el uso o la facturación, ponte en contacto con tu administrador de AWS cuentas.

Parámetros de transcripción en vivo de Amazon Chime SDK

Amazon Transcribe y Amazon Transcribe APIs Medical ofrecen varios parámetros al iniciar la transcripción en streaming, como StartStreamTranscription y StartMedicalStreamTranscription. Puede usar esos parámetros en la StartMeetingTranscription API, a menos que el SDK de Amazon Chime predetermine el valor del parámetro. Por ejemplo, los parámetros MediaEncoding y MediaSampleRateHertz no están disponibles porque Amazon Chime SDK los establece automáticamente.

Amazon Transcribe y Amazon Transcribe Medical validan los parámetros, lo que le permite utilizar nuevos valores de parámetros tan pronto como estén disponibles. Por ejemplo, si Amazon Transcribe Medical lanza la compatibilidad con un nuevo idioma, solo tiene que especificar el valor del nuevo idioma en el parámetro LanguageCode.