Identificazione della lingua con trascrizioni in streaming - Amazon Transcribe

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Identificazione della lingua con trascrizioni in streaming

L'identificazione della lingua in streaming può identificare la lingua dominante parlata nel tuo flusso multimediale. Amazon Transcribe richiede un minimo di tre secondi di conversazione per identificare la lingua.

Se il flusso contiene una sola lingua, puoi abilitare l’identificazione monolingue, che identifica la lingua dominante parlata nel file multimediale e crea la trascrizione utilizzando solo questa lingua.

Se il flusso contiene più di una lingua, è possibile abilitare l’identificazione multilingue, che identifica tutte le lingue parlate nel flusso e crea la trascrizione utilizzando ogni lingua identificata. Nota che viene prodotta una trascrizione multilingue. È possibile utilizzare altri servizi, ad esempio Amazon Transcribe, per tradurre la trascrizione.

Per utilizzare l'identificazione della lingua in streaming, è necessario fornire almeno due codici linguistici ed è possibile selezionare solo un dialetto linguistico per lingua per flusso. Ciò significa che non è possibile selezionare en-US e en-AU come opzioni linguistiche per la stessa trascrizione.

Hai anche la possibilità di selezionare una lingua preferita dal set di codici di lingua che fornisci. L'aggiunta di una lingua preferita può velocizzare il processo di identificazione della lingua, utile per brevi clip audio.

Importante

Se nessuno dei codici di lingua che fornisci corrisponde alla lingua o alle lingue identificate nell'audio, Amazon Transcribe seleziona la lingua più simile tra i codici di lingua specificati. Quindi produce una trascrizione in quella lingua. Ad esempio, se i file multimediali sono in inglese americano (en-US) e fornisci a Amazon Transcribe i codici di lingua zh-CN, fr-FR e de-DE, è probabile che Amazon Transcribe abbini i file multimediali al tedesco (de-DE) e produca una trascrizione in lingua tedesca. La mancata corrispondenza dei codici linguistici e delle lingue parlate può comportare una trascrizione imprecisa, pertanto consigliamo cautela nell'includere i codici di lingua.

Se i tuoi file multimediali contengono due canali, Amazon Transcribe può identificare la lingua dominante parlata in ogni canale. In questo caso, imposta il parametro ChannelIdentification su true e ogni canale viene trascritto separatamente. Tieni presente che il valore predefinito per questo parametro è false. Se non lo modifichi, viene trascritto solo il primo canale e viene identificata una sola lingua.

L'identificazione della lingua in streaming non può essere combinata con modelli linguistici personalizzati o la redazione. Se si combina l'identificazione della lingua con altre funzionalità, si è limitati alle lingue supportate da tali funzionalità e anche dalle trascrizioni in streaming. Fai riferimento a Lingue supportate.

Nota

PCM e FLAC sono gli unici formati audio supportati per l'identificazione della lingua in streaming.

Identificazione della lingua nell'audio multilingue

L'identificazione multilingue è destinata ai flussi multilingue e fornisce una trascrizione che riflette tutte le lingue supportate parlate nei flussi. Ciò significa che se chi parla cambia lingua durante la conversazione o se ogni partecipante parla una lingua diversa, l'output della trascrizione rileva e trascrive correttamente ogni lingua.

Ad esempio, se il flusso contiene un parlante bilingue che alterna l'inglese americano (en-US) e l'hindi (hi-IN), l'identificazione multilingue può identificare e trascrivere l'inglese americano parlato come en-US e l'hindi parlato come hi-IN. Ciò differisce dall'identificazione monolingue, in cui viene utilizzata una sola lingua dominante per creare una trascrizione. In questo caso, qualsiasi lingua parlata che non sia la lingua dominante viene trascritta in modo errato.

Nota

La redazione e i modelli linguistici personalizzati non sono attualmente supportati con l'identificazione multilingue.

Utilizzo dell'identificazione linguistica con contenuti multimediali in streaming

Puoi utilizzare l'identificazione automatica della lingua in una trascrizione in streaming utilizzando la AWS Management Console, HTTP/2 o i WebSocket; vedi quanto segue per alcuni esempi:

  1. Accedi alla AWS Management Console.

  2. Nel riquadro di navigazione scegli Trascrizione in tempo reale. Scorri verso il basso fino a Impostazioni lingua ed espandi questo campo se è ridotto al minimo.

    Schermata della console Amazon Transcribe: la scheda 'impostazioni lingua' ridotta nella pagina 'trascrizione in tempo reale'.
  3. Seleziona Identificazione automatica della lingua o Identificazione automatica di più lingue.

    Schermata della console Amazon Transcribe: la scheda 'impostazioni lingua' estesa.
  4. Fornisci un minimo di due codici di lingua per la trascrizione. Tieni presente che puoi fornire un solo dialetto per lingua. Ad esempio, non è possibile selezionare en-US e fr-CA come opzioni di lingua per la stessa trascrizione.

    Schermata della console Amazon Transcribe: il menu a discesa per la selezione del codice della lingua.
  5. (Facoltativo) Dal sottoinsieme di lingue selezionato nel passaggio precedente, puoi scegliere una lingua preferita per la trascrizione.

    Schermata della console Amazon Transcribe: il pannello 'impostazioni lingua' con le opzioni di lingua preferita.
  6. A questo punto puoi eseguire la trascrizione del flusso. Seleziona Avvia streaming e inizia a parlare. Per terminare la dettatura, seleziona Interrompi streaming.

Questo esempio crea una richiesta HTTP/2 con l'identificazione della lingua abilitata. Per ulteriori informazioni sull’uso degli streaming HTTP/2 con Amazon Transcribe, consulta Impostazione di un flusso HTTP/2. Per ulteriori dettagli sui parametri e le intestazioni specifici di Amazon Transcribe, consulta StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-identify-language: true x-amzn-transcribe-language-options: en-US,de-DE x-amzn-transcribe-preferred-language: en-US transfer-encoding: chunked

Questo esempio crea una richiesta HTTP/2 con l'identificazione di più lingue abilitata. Per ulteriori informazioni sull’uso degli streaming HTTP/2 con Amazon Transcribe, consulta Impostazione di un flusso HTTP/2. Per ulteriori dettagli sui parametri e le intestazioni specifici di Amazon Transcribe, consulta StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-identify-multiple-languages: true x-amzn-transcribe-language-options: en-US,de-DE x-amzn-transcribe-preferred-language: en-US transfer-encoding: chunked

Se usi identify-language o identify-multiple-languages nella richiesta, dovrai includere anche language-options. Non è possibile utilizzare sia language-code che identify-language nella stessa richiesta.

Le definizioni dei parametri sono disponibili nella Documentazione di riferimento dell’API; i parametri comuni a tutte le operazioni dell’API AWS sono elencati nella sezione Parametri comuni.

Questo esempio crea un URL prefirmato che utilizza l’identificazione della lingua in un flusso WebSocket. Le interruzioni di riga sono state aggiunte per la leggibilità. Per ulteriori informazioni sull’uso dei flussi WebSocket con Amazon Transcribe, consulta Configurazione di uno WebSocket stream. Per ulteriori dettagli sui parametri, consulta StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &media-encoding=flac &sample-rate=16000 &identify-language=true &language-options=en-US,de-DE &preferred-language=en-US

Questo esempio crea un URL prefirmato che utilizza l’identificazione di più lingue in un flusso WebSocket. Le interruzioni di riga sono state aggiunte per la leggibilità. Per ulteriori informazioni sull’uso dei flussi WebSocket con Amazon Transcribe, consulta Configurazione di uno WebSocket stream. Per ulteriori dettagli sui parametri, consulta StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &media-encoding=flac &sample-rate=16000 &identify-multiple-languages=true &language-options=en-US,de-DE &preferred-language=en-US

Se usi identify-language o identify-multiple-languages nella richiesta, dovrai includere anche language-options. Non è possibile utilizzare sia language-code che identify-language nella stessa richiesta.

Le definizioni dei parametri sono disponibili nella Documentazione di riferimento dell’API; i parametri comuni a tutte le operazioni dell’API AWS sono elencati nella sezione Parametri comuni.