Solicitud de transcripciones alternativas

Transcripciones alternativas

Cuando Amazon Transcribe transcribe audio, crea diferentes versiones de la misma transcripción y asigna una puntuación de confianza a cada versión. En una transcripción típica, sólo se obtiene la versión con la puntuación de confianza más alta.

Si activas las transcripciones alternativas, Amazon Transcribe devuelve otras versiones de la transcripción que tengan niveles de confianza más bajos. Puede elegir una devolución de hasta 10 transcripciones alternativas. Si especifica un número de alternativas superior al que Amazon Transcribe identifica, solo se devolverá el número real de alternativas.

Todas las alternativas se ubican en el mismo archivo de salida de la transcripción y se presentan a nivel de segmento. Los segmentos se definen a través de las pausas naturales del habla, como un cambio de interlocutor o una pausa en el audio.

Las transcripciones alternativas sólo están disponibles para las transcripciones por lotes.

El resultado de la transcripción está estructurado de la siguiente manera. Los puntos suspensivos (...) de los ejemplos de código indican dónde se ha eliminado el contenido por motivos de brevedad.

Una transcripción final completa de un segmento determinado.


"results": {
    "language_code": "en-US",
    "transcripts": [
        {
            "transcript": "The amazon is the largest rainforest on the planet."
        }
    ],

Una puntuación de confianza para cada palabra de la sección de transcript anterior.


"items": [
    {
        "start_time": "1.15",
        "end_time": "1.35",
        "alternatives": [
            {
                "confidence": "1.0",
                "content": "The"
            }
        ],
        "type": "pronunciation"
    },
    {
        "start_time": "1.35",
        "end_time": "2.05",
        "alternatives": [
            {
                "confidence": "1.0",
                "content": "amazon"
            }
        ],
        "type": "pronunciation"
    },

Las transcripciones alternativas se encuentran en la parte segments del resultado de la transcripción. Las alternativas para cada segmento se ordenan por puntuación de confianza descendente.


"segments": [
            {
                "start_time": "1.04",
                "end_time": "5.065",
                "alternatives": [
                    {    
                ...
                        "transcript": "The amazon is the largest rain forest on the planet.",
                        "items": [
                            {
                             "start_time": "1.15",
                                "confidence": "1.0",
                                "end_time": "1.35",
                                "type": "pronunciation",
                                "content": "The"
                            },
                            ...
                            {
                                "start_time": "3.06",
                                "confidence": "0.0037",
                                "end_time": "3.38",
                                "type": "pronunciation",
                                "content": "rain"
                            },
                            {
                                "start_time": "3.38",
                                "confidence": "0.0037",
                                "end_time": "3.96",
                                "type": "pronunciation",
                                "content": "forest"
                            },

Un status al final del resultado de la transcripción.
```
"status": "COMPLETED"
}
```

Solicitud de transcripciones alternativas

Puede solicitar transcripciones alternativas mediante AWS Management ConsoleAWS CLI, o AWS SDKs; consulte los siguientes ejemplos:

Inicie sesión en la AWS Management Console.
En el panel de navegación, elija Trabajos de transcripción y, a continuación, seleccione Crear trabajo (arriba a la derecha). Se abrirá la página Especificar los detalles del trabajo.
Rellene los campos que desee incluir en la página Especificar los detalles del trabajo y, a continuación, seleccione Siguiente. Esto lo llevará a la página Configurar trabajo: opcional.

Seleccione Resultados alternativos y especifique el número máximo de alternativas que desee incluir en el resultado de la transcripción.
Seleccione Crear trabajo para ejecutar su trabajo de transcripción.

En este ejemplo se utilizan el start-transcription-jobcomando y ShowAlternatives el parámetro. Para obtener más información, consulte StartTranscriptionJob y ShowAlternatives.

Tenga en cuenta que si incluye ShowAlternatives=true en su solicitud, también debe incluir MaxAlternatives.


aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--settings ShowAlternatives=true,MaxAlternatives=4

Este es otro ejemplo en el que se utiliza el start-transcription-jobcomando y un cuerpo de solicitud que incluye transcripciones alternativas.


aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://filepath/my-first-alt-transcription-job.json

El archivo my-first-alt-transcription-job.json contiene el siguiente cuerpo de solicitud.


{
  "TranscriptionJobName": "my-first-transcription-job",  
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
   },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "Settings": {
        "ShowAlternatives": true,
        "MaxAlternatives": 4
   }
}

En el siguiente ejemplo, se utiliza AWS SDK para Python (Boto3) para solicitar transcripciones alternativas mediante el ShowAlternatives argumento del método start_transcription_job. Para obtener más información, consulte StartTranscriptionJob y ShowAlternatives.

Para ver más ejemplos en los que se utilizan escenarios y servicios cruzados AWS SDKs, incluidos ejemplos específicos de funciones, consulte el capítulo. Ejemplos de código para Amazon Transcribe usando AWS SDKs

Tenga en cuenta que si incluye 'ShowAlternatives':True en su solicitud, también debe incluir MaxAlternatives.


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    Settings = {
        'ShowAlternatives':True, 
        'MaxAlternatives':4
    }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Identificación del idioma en streaming

Mejora de la precisión de la transcripción