Utilizzo della trascrizione live di Amazon Chime SDK - Amazon Chime SDK

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo della trascrizione live di Amazon Chime SDK

Utilizzi la trascrizione live di Amazon Chime SDK per generare trascrizioni live delle riunioni attribuite all'utente. La trascrizione live di Amazon Chime SDK si integra con i servizi Amazon Transcribe e Amazon Transcribe Medical per generare trascrizioni delle riunioni SDK Amazon Chime mentre sono in corso.

La trascrizione live di Amazon Chime SDK elabora l'audio di ogni utente separatamente per una maggiore precisione in scenari con più altoparlanti. L'SDK Amazon Chime utilizza il suo algoritmo Active Talker per selezionare i primi due oratori attivi, quindi invia il loro audio ad Amazon Transcribe, in canali separati, tramite un unico flusso. I partecipanti alla riunione ricevono trascrizioni attribuite dall'utente tramite messaggi di dati SDK Amazon Chime. Puoi utilizzare le trascrizioni in vari modi, ad esempio visualizzando i sottotitoli, creando trascrizioni delle riunioni o utilizzando le trascrizioni per l'analisi del contenuto.

La trascrizione in tempo reale utilizza uno stream su Amazon Transcribe per tutta la durata della trascrizione della riunione. Si applicano i costi standard di Amazon Transcribe e Amazon Transcribe Medical. Per ulteriori informazioni, consulta i prezzi di Amazon Transcribe. Per domande sull'utilizzo o sulla fatturazione, contatta il tuo AWS account manager.

Importante

Per impostazione predefinita, Amazon Transcribe può utilizzare e archiviare contenuti audio elaborati dal servizio per sviluppare e AWS migliorare i servizi AI/ML, come ulteriormente descritto nella sezione 50 dei Termini di servizio.AWS L'uso di Amazon Transcribe può essere soggetto a leggi o regolamenti federali e statali riguardanti la registrazione o l'intercettazione di comunicazioni elettroniche. È tua responsabilità e dei tuoi utenti finali rispettare tutte le leggi applicabili in materia di registrazione, inclusa la corretta notifica a tutti i partecipanti a una sessione o comunicazione registrata che la sessione o la comunicazione è in corso di registrazione e l'ottenimento di tutti i consensi necessari. Puoi scegliere di non AWS utilizzare contenuti audio per sviluppare e migliorare i servizi AWS AI/ML configurando una politica di disattivazione dei servizi di intelligenza artificiale utilizzando Organizations. AWS

Architettura del sistema

L'SDK Amazon Chime crea trascrizioni delle riunioni in tempo reale, senza che l'audio esca dalla AWS rete, tramite un'integrazione lato servizio con il tuo account Amazon Transcribe o Amazon Transcribe Medical. Per una maggiore precisione, l'audio degli utenti viene elaborato separatamente, quindi mixato alla riunione. L'SDK Amazon Chime utilizza il suo algoritmo Active Talker per selezionare i primi due oratori attivi, quindi invia il loro audio ad Amazon Transcribe o Amazon Transcribe Medical in canali separati tramite un unico flusso. Per ridurre la latenza, le trascrizioni attribuite dall'utente vengono inviate direttamente a ogni partecipante alla riunione tramite messaggi di dati. Quando si utilizza una pipeline multimediale per acquisire l'audio della riunione, vengono acquisite anche le informazioni di trascrizione della riunione.

Un diagramma che mostra il flusso di dati della trascrizione delle riunioni.

Fatturazione e utilizzo

La trascrizione in tempo reale utilizza uno streaming verso Amazon Transcribe o Amazon Transcribe Medical per tutta la durata della trascrizione della riunione. Si applicano i costi standard di Amazon Transcribe e Amazon Transcribe Medical. Per ulteriori informazioni, consulta la pagina dei prezzi di Amazon Transcribe. Per domande sull'utilizzo o sulla fatturazione, contatta il tuo AWS account manager.

Parametri di trascrizione

Le API Amazon Transcribe e Amazon Transcribe Medical offrono una serie di parametri per l'avvio della trascrizione in streaming, ad esempio e. StartStreamTranscriptionStartMedicalStreamTranscription Puoi utilizzare t quei parametri nell'StartMeetingTranscriptionAPI a meno che l'SDK Amazon Chime non predetermini il valore del parametro. Ad esempio, i MediaSampleRateHertz parametri MediaEncoding and non sono disponibili perché l'SDK Amazon Chime li imposta automaticamente.

Amazon Transcribe e Amazon Transcribe Medical convalidano i parametri e ciò consente di utilizzare nuovi valori dei parametri non appena diventano disponibili. Ad esempio, se Amazon Transcribe Medical avvia il supporto per una nuova lingua, devi solo specificare il nuovo valore della lingua nel parametro. LanguageCode