Transcrevendo áudio multicanal - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Transcrevendo áudio multicanal

Se o áudio tiver dois canais, você poderá usar a identificação do canal para transcrever a fala de cada canal separadamente. Amazon Transcribeatualmente não suporta áudio com mais de dois canais.

Em sua transcrição, os canais recebem os rótulosch_0ch_1 e.

Além das seções de transcrição padrão (transcriptseitems), as solicitações com identificação de canal ativada incluem umachannel_labels seção. Esta seção contém cada expressão ou sinal de pontuação, agrupado por canal, e seu rótulo de canal associado, carimbos de data e hora e pontuação de confiança.

"channel_labels": { "channels": [ { "channel_label": "ch_0", "items": [ { "channel_label": "ch_0", "start_time": "4.86", "end_time": "5.01", "alternatives": [ { "confidence": "1.0", "content": "I've" } ], "type": "pronunciation" }, ... "channel_label": "ch_1", "items": [ { "channel_label": "ch_1", "start_time": "8.5", "end_time": "8.89", "alternatives": [ { "confidence": "1.0", "content": "Sorry" } ], "type": "pronunciation" }, ... "number_of_channels": 2 },

Observe que, se uma pessoa em um canal fala ao mesmo tempo que uma pessoa em um canal separado, os registros de data e hora de cada canal se sobrepõem enquanto os indivíduos estão falando uns sobre os outros.

Para ver um exemplo completo de transcrição com identificação de canal, consulteExemplo de saída de identificação de canal (lote).

Usando a identificação de canais em uma transcrição em lote

Para identificar canais em uma transcrição em lote, você pode usar os SDKs AWS Management ConsoleAWS CLI, ou AWSos SDKs; veja exemplos a seguir:

  1. Faça login no AWS Management Console.

  2. No painel de navegação, escolha Trabalhos de transcrição e selecione Criar tarefa (canto superior direito). Isso abre a página Especificar detalhes do trabalho.

    Amazon Transcribepágina “Especificar detalhes do trabalho” do console. No painel “Configurações do trabalho”, você pode especificar um nome para seu Job de transcrição, selecionar um tipo de modelo e especificar suas configurações de idioma.
  3. Preencha os campos que você deseja incluir na página Especificar detalhes do trabalho e selecione Avançar. Isso leva você à página Configurar tarefa - opcional.

    No painel Configurações de áudio, selecione Identificação do canal (sob o título “Tipo de identificação de áudio”).

    Amazon Transcribepágina “Configurar trabalho” do console. No painel “Configurações de áudio”, você pode ativar a identificação do canal.
  4. Selecione Criar tarefa para executar sua tarefa de transcrição.

Este exemplo usa o start-transcription-job. Para obter mais informações, consulte StartTranscriptionJob.

aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --output-key my-output-files/ \ --language-code en-US \ --settings ChannelIdentification=true

Aqui está outro exemplo usando o start-transcription-jobcomando e um corpo de solicitação que permite a identificação do canal com essa tarefa.

aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://my-first-transcription-job.json

O arquivo my-first-transcription-job.json contém o seguinte corpo da solicitação.

{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Settings": { "ChannelIdentification": true } }

Este exemplo usa oAWS SDK for Python (Boto3) para identificar canais usando o método start_transcription_job. Para obter mais informações, consulte StartTranscriptionJob

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Settings = { 'ChannelIdentification':True } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

Usando a identificação de canais em uma transcrição de streaming

Para identificar canais em uma transcrição de streaming, você pode usar HTTP/2 ou WebSockets; veja exemplos a seguir:

Este exemplo cria uma solicitação HTTP/2 que separa canais em sua saída de transcrição. Para obter mais informações sobre como usar o streaming HTTP/2 comAmazon Transcribe, consulteConfigurar um fluxo de HTTP/2. Para obter mais detalhes sobre parâmetros e cabeçalhos específicos paraAmazon Transcribe, consulte StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-channel-identification: TRUE transfer-encoding: chunked

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operaçõesAWS da API estão listados na seção Parâmetros comuns.

Este exemplo cria um URL pré-assinado que separa os canais em sua saída de transcrição. Quebras de linha foram adicionadas para uma melhor leitura. Para obter mais informações sobre como usar WebSocket streams comAmazon Transcribe, consulteConfigurando um WebSocket stream. Para obter mais detalhes sobre os parâmetros, consulte StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &specialty=PRIMARYCARE &type=DICTATION &media-encoding=flac &sample-rate=16000 &channel-identification=TRUE

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operaçõesAWS da API estão listados na seção Parâmetros comuns.