Transcrições alternativas - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Transcrições alternativas

QuandoAmazon Transcribe transcreve o áudio, ele cria versões diferentes da mesma transcrição e atribui uma pontuação de confiança a cada versão. Em uma transcrição típica, você só obtém a versão com a maior pontuação de confiança.

Se você ativar as transcrições alternativas,Amazon Transcribe retornará outras versões da sua transcrição que tenham níveis de confiança mais baixos. Você pode optar por ter até 10 transcrições alternativas retornadas. Se você especificar um número maior de alternativas do que oAmazon Transcribe identificador, somente o número real de alternativas será retornado.

Todas as alternativas estão localizadas no mesmo arquivo de saída da transcrição e são apresentadas no nível do segmento. Os segmentos são pausas naturais na fala, como uma mudança no alto-falante ou uma pausa no áudio.

As transcrições alternativas só estão disponíveis para transcrições em lote.

Sua maneira a seguir é estruturada da maneira a seguir. As elipses (... ) nos exemplos de código indicam onde o conteúdo foi removido por questões de brevidade.

  1. Uma transcrição final completa para um determinado segmento.

    "results": { "language_code": "en-US", "transcripts": [ { "transcript": "The amazon is the largest rainforest on the planet." } ],
  2. Uma pontuação de confiança para cada palavra natranscript seção anterior.

    "items": [ { "start_time": "1.15", "end_time": "1.35", "alternatives": [ { "confidence": "1.0", "content": "The" } ], "type": "pronunciation" }, { "start_time": "1.35", "end_time": "2.05", "alternatives": [ { "confidence": "1.0", "content": "amazon" } ], "type": "pronunciation" },
  3. Suas transcrições alternativas estão localizadas nasegments parte da saída da transcrição. As alternativas para cada segmento são ordenadas por pontuação de confiança decrescente.

    "segments": [ { "start_time": "1.04", "end_time": "5.065", "alternatives": [ { ... "transcript": "The amazon is the largest rain forest on the planet.", "items": [ { "start_time": "1.15", "confidence": "1.0", "end_time": "1.35", "type": "pronunciation", "content": "The" }, ... { "start_time": "3.06", "confidence": "0.0037", "end_time": "3.38", "type": "pronunciation", "content": "rain" }, { "start_time": "3.38", "confidence": "0.0037", "end_time": "3.96", "type": "pronunciation", "content": "forest" },
  4. Um status no final da saída da transcrição.

    "status": "COMPLETED" }

Solicitando transcrições alternativas

Você pode solicitar transcrições alternativas usando os SDKs AWS Management ConsoleAWS CLI, ou AWSos SDKs; veja exemplos a seguir:

  1. Faça login no AWS Management Console.

  2. No painel de navegação, escolha Trabalhos de transcrição e selecione Criar tarefa (canto superior direito). Isso abre a página Especificar detalhes do trabalho.

    Amazon Transcribepágina “Especificar detalhes do trabalho” do console. No painel “Configurações do trabalho”, você pode especificar um nome para seu Job de transcrição, selecionar um tipo de modelo e especificar suas configurações de idioma.
  3. Preencha os campos que você deseja incluir na página Especificar detalhes do trabalho e selecione Avançar. Isso leva você à página Configurar tarefa - opcional.

    Selecione Resultados alternativos e especifique o número máximo de resultados de transcrição alternativos que você deseja em sua transcrição.

    Amazon Transcribepágina “Configurar trabalho” do console. No painel “Configurações de áudio”, você pode ativar os resultados alternativos e especificar o número máximo de alternativas que deseja incluir na saída da transcrição.
  4. Selecione Criar tarefa para executar sua tarefa de transcrição.

Este exemplo usa o start-transcription-jobcomando e oShowAlternatives parâmetro. Para obter mais informações, consulte StartTranscriptionJob e ShowAlternatives.

Observe que, se você incluirShowAlternatives=true em sua solicitação, também deverá incluirMaxAlternatives.

aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --output-key my-output-files/ \ --language-code en-US \ --settings ShowAlternatives=true,MaxAlternatives=4

Aqui está outro exemplo usando o start-transcription-jobcomando e um corpo de solicitação que inclui transcrições alternativas.

aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://filepath/my-first-alt-transcription-job.json

O arquivo my-first-alt-transcription-job.json contém o seguinte corpo da solicitação.

{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 4 } }

O exemplo a seguir usa oAWS SDK for Python (Boto3) para solicitar transcrições alternativas usando oShowAlternatives argumento para o método start_transcription_job. Para obter mais informações, consulte StartTranscriptionJob e ShowAlternatives.

Para obter exemplos adicionais de uso dosAWS SDKs, incluindo exemplos específicos de recursos, cenários e serviços cruzados, consulte oExemplos de código para o Amazon Transcribe usando SDKs AWS capítulo.

Observe que, se você incluir'ShowAlternatives':True em sua solicitação, também deverá incluirMaxAlternatives.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Settings = { 'ShowAlternatives':True, 'MaxAlternatives':4 } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)