Identificazione della lingua nell'audio multilingue Utilizzo dell'identificazione linguistica con contenuti multimediali in streaming

Identificazione della lingua con trascrizioni in streaming

L'identificazione della lingua di streaming può identificare la lingua dominante parlata nel tuo flusso multimediale. Amazon Transcribe richiede almeno un secondo di discorso per identificare la lingua.

Se il flusso contiene una sola lingua, puoi abilitare l’identificazione monolingue, che identifica la lingua dominante parlata nel file multimediale e crea la trascrizione utilizzando solo questa lingua.

Se il flusso contiene più di una lingua, è possibile abilitare l’identificazione multilingue, che identifica tutte le lingue parlate nel flusso e crea la trascrizione utilizzando ogni lingua identificata. Nota che viene prodotta una trascrizione multilingue. Puoi utilizzare altri servizi, ad esempio Amazon Transcribe per tradurre la tua trascrizione.

Per utilizzare l'identificazione della lingua in streaming, è necessario fornire almeno due codici linguistici ed è possibile selezionare solo un dialetto linguistico per lingua per flusso. Ciò significa che non è possibile selezionare en-US e en-AU come opzioni linguistiche per la stessa trascrizione.

Hai anche la possibilità di selezionare una lingua preferita dal set di codici di lingua che fornisci. L'aggiunta di una lingua preferita può velocizzare il processo di identificazione della lingua, utile per brevi clip audio.

Importante

Se nessuno dei codici di lingua forniti corrisponde alla lingua o alle lingue identificate nell'audio, Amazon Transcribe seleziona la lingua più simile tra i codici di lingua specificati. Quindi produce una trascrizione in quella lingua. Ad esempio, se i file multimediali sono in inglese americano (en-US) e fornisci Amazon Transcribe i codici di lingua zh-CN fr-FRde-DE, ed Amazon Transcribe è probabile che abbini i file multimediali al tedesco (de-DE) e produca una trascrizione in lingua tedesca. La mancata corrispondenza dei codici linguistici e delle lingue parlate può comportare una trascrizione imprecisa, pertanto consigliamo cautela nell'includere i codici di lingua.

Se i tuoi file multimediali contengono due canali, Amazon Transcribe puoi identificare la lingua dominante parlata in ogni canale. In questo caso, imposta il parametro ChannelIdentification su true e ogni canale viene trascritto separatamente. Tieni presente che il valore predefinito per questo parametro è false. Se non lo modifichi, viene trascritto solo il primo canale e viene identificata una sola lingua.

L'identificazione della lingua in streaming non può essere combinata con modelli linguistici personalizzati o la redazione. Se si combina l'identificazione della lingua con altre funzionalità, si è limitati alle lingue supportate da tali funzionalità e anche dalle trascrizioni in streaming. Fai riferimento a Lingue supportate.

Nota

PCM e FLAC sono gli unici formati audio supportati per l'identificazione della lingua in streaming. Per l'identificazione multilingue, è supportato solo il PCM.

Identificazione della lingua nell'audio multilingue

L'identificazione multilingue è destinata ai flussi multilingue e fornisce una trascrizione che riflette tutte le lingue supportate parlate nei flussi. Ciò significa che se chi parla cambia lingua durante la conversazione o se ogni partecipante parla una lingua diversa, l'output della trascrizione rileva e trascrive correttamente ogni lingua.

Ad esempio, se il flusso contiene un parlante bilingue che alterna l'inglese americano (en-US) e l'hindi (hi-IN), l'identificazione multilingue può identificare e trascrivere l'inglese americano parlato come en-US e l'hindi parlato come hi-IN. Ciò differisce dall'identificazione monolingue, in cui viene utilizzata una sola lingua dominante per creare una trascrizione. In questo caso, qualsiasi lingua parlata che non sia la lingua dominante viene trascritta in modo errato.

Nota

La redazione e i modelli linguistici personalizzati non sono attualmente supportati con l'identificazione multilingue.

Utilizzo dell'identificazione linguistica con contenuti multimediali in streaming

È possibile utilizzare l'identificazione automatica della lingua in una trascrizione in streaming utilizzando HTTP/2 o WebSockets; per esempi, vedere quanto segue: AWS Management Console

Accedi alla AWS Management Console.
Nel riquadro di navigazione scegli Trascrizione in tempo reale. Scorri verso il basso fino a Impostazioni lingua ed espandi questo campo se è ridotto al minimo.
Seleziona Identificazione automatica della lingua o Identificazione automatica di più lingue.
Fornisci un minimo di due codici di lingua per la trascrizione. Tieni presente che puoi fornire un solo dialetto per lingua. Ad esempio, non è possibile selezionare en-US e fr-CA come opzioni di lingua per la stessa trascrizione.
(Facoltativo) Dal sottoinsieme di lingue selezionato nel passaggio precedente, puoi scegliere una lingua preferita per la trascrizione.
A questo punto puoi eseguire la trascrizione del flusso. Seleziona Avvia streaming e inizia a parlare. Per terminare la dettatura, seleziona Interrompi streaming.

Questo esempio crea una richiesta HTTP/2 con l'identificazione della lingua abilitata. Per ulteriori informazioni sull'utilizzo dello streaming HTTP/2 con, consulta. Amazon TranscribeImpostazione di un flusso HTTP/2 Per ulteriori dettagli sui parametri e sulle intestazioni specifici di, consulta. Amazon TranscribeStartStreamTranscription


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-language: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked

Questo esempio crea una richiesta HTTP/2 con l'identificazione di più lingue abilitata. Per ulteriori informazioni sull'utilizzo dello streaming HTTP/2 con Amazon Transcribe, consulta. Impostazione di un flusso HTTP/2 Per ulteriori dettagli sui parametri e sulle intestazioni specifici di, consulta. Amazon TranscribeStartStreamTranscription


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-multiple-languages: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked

Se usi identify-language o identify-multiple-languages nella richiesta, dovrai includere anche language-options. Non è possibile utilizzare sia language-code che identify-language nella stessa richiesta.

Le definizioni dei parametri sono disponibili nell'API Reference; i parametri comuni a tutte le operazioni AWS API sono elencati nella sezione Parametri comuni.

Questo esempio crea un URL predefinito che utilizza l'identificazione della lingua in uno WebSocket stream. Le interruzioni di riga sono state aggiunte per la leggibilità. Per ulteriori informazioni sull'utilizzo degli WebSocket stream con Amazon Transcribe, consulta. Configurazione di uno WebSocket stream Per ulteriori dettagli sui parametri, consulta StartStreamTranscription.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-language=true
&language-options=en-US,de-DE
&preferred-language=en-US

Questo esempio crea un URL predefinito che utilizza l'identificazione in più lingue in uno WebSocket stream. Le interruzioni di riga sono state aggiunte per la leggibilità. Per ulteriori informazioni sull'utilizzo degli WebSocket stream con Amazon Transcribe, consulta. Configurazione di uno WebSocket stream Per ulteriori dettagli sui parametri, consulta StartStreamTranscription.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-multiple-languages=true
&language-options=en-US,de-DE
&preferred-language=en-US

Le definizioni dei parametri sono disponibili nell'API Reference; i parametri comuni a tutte le operazioni AWS API sono elencati nella sezione Parametri comuni.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

identificazione della lingua in batch

Trascrizioni alternative