Uso de la transcripción en directo de Amazon Chime SDK - Amazon Chime SDK

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de la transcripción en directo de Amazon Chime SDK

Utiliza la transcripción SDK en directo de Amazon Chime para generar transcripciones en directo de sus reuniones atribuidas a los usuarios. La transcripción SDK en directo de Amazon Chime se integra con los servicios Amazon Transcribe y Amazon Transcribe Medical para generar transcripciones de las reuniones de Amazon Chime mientras están en curso. SDK

La transcripción SDK en directo de Amazon Chime procesa el audio de cada usuario por separado para mejorar la precisión en escenarios con varios altavoces. Amazon Chime SDK usa su algoritmo de altavoz activo para seleccionar los dos principales hablantes activos y, a continuación, envía su audio a Amazon Transcribe, en canales separados, a través de una sola transmisión. Los participantes de la reunión reciben transcripciones atribuidas a los usuarios a través de mensajes de datos de Amazon SDK Chime. Puede usar las transcripciones de diversas maneras, como mostrar subtítulos, crear transcripciones de reuniones o usar las transcripciones para analizar el contenido.

La transcripción en directo utiliza una transmisión para Amazon Transcribe durante la transcripción de la reunión. Se aplican las tarifas estándar de Amazon Transcribe y Amazon Transcribe Medical. Para obtener más información, consulte los precios de Amazon Transcribe. Si tiene preguntas sobre el uso o la facturación, póngase en contacto con su AWS administrador de cuentas.

importante

De forma predeterminada, Amazon Transcribe puede usar y almacenar contenido de audio procesado por el servicio para desarrollar y mejorar los servicios de AWS inteligencia artificial y aprendizaje automático, tal como se describe con más detalle en la sección 50 de las Condiciones del servicio.AWS El uso de Amazon Transcribe puede estar sujeto a las leyes o reglamentos federales y estatales relacionados con la grabación o la interceptación de comunicaciones electrónicas. Es su responsabilidad y la de los usuarios finales cumplir con todas las leyes aplicables en relación con la grabación, incluida la notificación adecuada a todos los participantes de una sesión o comunicación grabada de que la sesión o la comunicación se está grabando y obtener todos los consentimientos necesarios. Puede optar por no AWS usar contenido de audio para desarrollar y mejorar los servicios de AWS IA/ML configurando una política de exclusión de los servicios de IA mediante Organizations AWS .

Arquitectura del sistema

Amazon Chime SDK crea transcripciones de reuniones en tiempo real, sin que el audio salga de la AWS red, mediante una integración del lado del servicio con su cuenta de Amazon Transcribe o Amazon Transcribe Medical. Para mejorar la precisión, el audio de los usuarios se procesa por separado y luego se mezcla en la reunión. Amazon Chime SDK utiliza su algoritmo de altavoz activo para seleccionar los dos principales altavoces activos y, a continuación, envía su audio a Amazon Transcribe o Amazon Transcribe Medical en canales separados mediante una sola transmisión. Para reducir la latencia, las transcripciones atribuidas a los usuarios se envían directamente a todos los participantes de la reunión mediante mensajes de datos. Cuando se utiliza una canalización de medios para capturar el audio de la reunión, también se captura la información de transcripción de la reunión.

Un diagrama que muestra el flujo de datos de la transcripción de una reunión.

Facturación y uso

La transcripción en directo utiliza una transmisión a Amazon Transcribe o Amazon Transcribe Medical durante la transcripción de la reunión. Se aplican las tarifas estándar de Amazon Transcribe y Amazon Transcribe Medical. Para obtener más información, consulte Precios de Amazon Transcribe. Si tiene preguntas sobre el uso o la facturación, póngase en contacto con su administrador de AWS cuentas.

Parámetros de transcripción

Amazon Transcribe y Amazon Transcribe APIs Medical ofrecen varios parámetros al iniciar la transcripción en streaming, como StartStreamTranscription y StartMedicalStreamTranscription. Puede usar t esos parámetros en el, StartMeetingTranscription API a menos que Amazon Chime SDK predetermine el valor del parámetro. Por ejemplo, los MediaSampleRateHertz parámetros MediaEncoding y no están disponibles porque Amazon Chime los SDK establece automáticamente.

Amazon Transcribe y Amazon Transcribe Medical validan los parámetros, lo que le permite utilizar nuevos valores de parámetros tan pronto como estén disponibles. Por ejemplo, si Amazon Transcribe Medical lanza la compatibilidad con un nuevo idioma, solo tiene que especificar el valor del nuevo idioma en el parámetro LanguageCode.