Transcripciones alternativas - Amazon Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Transcripciones alternativas

CuandoAmazon Transcribe transcribe audio, crea diferentes versiones de la misma transcripción y asigna una puntuación de confianza a cada versión. En una transcripción típica, solo se obtiene la versión con la puntuación de confianza más alta.

Si activas las transcripciones alternativas,Amazon Transcribe devuelve otras versiones de la transcripción que tienen niveles de confianza más bajos. Puede elegir que se le devuelvan hasta 10 transcripciones alternativas. Si especifica un número de alternativas mayor al queAmazon Transcribe identifica, solo se devuelve el número real de alternativas.

Todas las alternativas se encuentran en el mismo archivo de salida de transcripción y se presentan a nivel de segmento. Los segmentos son pausas naturales en la voz, como un cambio de altavoz o una pausa en el audio.

Las transcripciones alternativas solo están disponibles para las transcripciones por lotes.

El instrucción tiene la estructura siguiente. Las elipses (... ) en los ejemplos de código indican dónde se ha eliminado el contenido por motivos de brevedad.

  1. Una transcripción final completa para un segmento determinado.

    "results": { "language_code": "en-US", "transcripts": [ { "transcript": "The amazon is the largest rainforest on the planet." } ],
  2. Una puntuación de confianza para cada palabra de latranscript sección anterior.

    "items": [ { "start_time": "1.15", "end_time": "1.35", "alternatives": [ { "confidence": "1.0", "content": "The" } ], "type": "pronunciation" }, { "start_time": "1.35", "end_time": "2.05", "alternatives": [ { "confidence": "1.0", "content": "amazon" } ], "type": "pronunciation" },
  3. Las transcripciones alternativas se encuentran en lasegments parte del resultado de la transcripción. Las alternativas para cada segmento se ordenan por puntuación de confianza descendente.

    "segments": [ { "start_time": "1.04", "end_time": "5.065", "alternatives": [ { ... "transcript": "The amazon is the largest rain forest on the planet.", "items": [ { "start_time": "1.15", "confidence": "1.0", "end_time": "1.35", "type": "pronunciation", "content": "The" }, ... { "start_time": "3.06", "confidence": "0.0037", "end_time": "3.38", "type": "pronunciation", "content": "rain" }, { "start_time": "3.38", "confidence": "0.0037", "end_time": "3.96", "type": "pronunciation", "content": "forest" },
  4. Un estado al final del resultado de la transcripción.

    "status": "COMPLETED" }

Solicitud de transcripciones alternativas

Puede solicitar transcripciones alternativas mediante los SDK AWS Management ConsoleAWS CLI, o AWSlos SDK; consulte los siguientes ejemplos:

  1. Inicie sesión en AWS Management Console.

  2. En el panel de navegación, selecciona Trabajos de transcripción y, a continuación, selecciona Crear trabajo (arriba a la derecha). Se abre la página Especificar detalles del trabajo.

    Amazon Transcribepágina «Especificar detalles del trabajo» de la consola. En el panel «Configuración del Job», puede especificar un nombre para su trabajo de transcripción, seleccionar un tipo de modelo y especificar la configuración de idioma.
  3. Rellene los campos que desee incluir en la página Especificar detalles del trabajo y, a continuación, seleccione Siguiente. Esto le llevará a la página Configurar trabajo: opcional.

    Seleccione Resultados alternativos y especifique el número máximo de resultados de transcripción alternativos que desea incluir en su transcripción.

    Amazon Transcribepágina «Configurar trabajo» de la consola. En el panel «Configuración de audio», puede habilitar los resultados alternativos y especificar el número máximo de alternativas que desea incluir en el resultado de la transcripción.
  4. Selecciona Crear trabajo para ejecutar tu trabajo de transcripción.

En este ejemplo se utilizan el start-transcription-jobcomando y elShowAlternatives parámetro. Para obtener más información, consulte StartTranscriptionJob y ShowAlternatives.

Tenga en cuenta que si lo incluyeShowAlternatives=true en su solicitud, también debe incluirloMaxAlternatives.

aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --output-key my-output-files/ \ --language-code en-US \ --settings ShowAlternatives=true,MaxAlternatives=4

Este es otro ejemplo de uso del start-transcription-jobcomando y un cuerpo de solicitud que incluye transcripciones alternativas.

aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://filepath/my-first-alt-transcription-job.json

El archivo my-first-alt-transcription-job.json contiene el siguiente cuerpo de solicitud.

{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 4 } }

En el siguiente ejemplo, se utilizaAWS SDK for Python (Boto3) para solicitar transcripciones alternativas mediante elShowAlternatives argumento del método start_transcription_job. Para obtener más información, consulte StartTranscriptionJob y ShowAlternatives.

Para ver más ejemplos de uso deAWS los SDK, incluidos ejemplos de funciones específicas, escenarios y multiservicios, consulte elEjemplos de código para Amazon Transcribe mediante SDK AWS capítulo.

Tenga en cuenta que si lo incluye'ShowAlternatives':True en su solicitud, también debe incluirloMaxAlternatives.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Settings = { 'ShowAlternatives':True, 'MaxAlternatives':4 } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)