Transcrições alternativas

Ao Amazon Transcribe transcrever o áudio, ele cria versões diferentes da mesma transcrição e atribui uma pontuação de confiança a cada versão. Em uma transcrição típica, você só obtém a versão com a maior pontuação de confiança.

Se você ativar as transcrições alternativas, Amazon Transcribe retornará outras versões da sua transcrição que tenham níveis de confiança mais baixos. Você pode optar por receber até dez transcrições alternativas. Se você especificar um número maior de alternativas do que o que Amazon Transcribe identifica, somente o número real de alternativas será retornado.

Todas as alternativas estão localizadas no mesmo arquivo de saída da transcrição e são apresentadas em nível de segmento. Os segmentos são pausas naturais na fala, como uma mudança de locutor ou uma pausa no áudio.

As transcrições alternativas estão disponíveis apenas em lote.

A saída da transcrição é estruturada como a seguir. As elipses (...) nos exemplos de código indicam onde o conteúdo foi removido por questões de brevidade.

Uma transcrição final completa para determinado segmento.


"results": {
    "language_code": "en-US",
    "transcripts": [
        {
            "transcript": "The amazon is the largest rainforest on the planet."
        }
    ],

Uma pontuação de confiança para cada palavra na seção transcript anterior.


"items": [
    {
        "start_time": "1.15",
        "end_time": "1.35",
        "alternatives": [
            {
                "confidence": "1.0",
                "content": "The"
            }
        ],
        "type": "pronunciation"
    },
    {
        "start_time": "1.35",
        "end_time": "2.05",
        "alternatives": [
            {
                "confidence": "1.0",
                "content": "amazon"
            }
        ],
        "type": "pronunciation"
    },

As transcrições alternativas estão localizadas na parte de segments da saída da transcrição. As alternativas para cada segmento são ordenadas pela pontuação de confiança decrescente.


"segments": [
            {
                "start_time": "1.04",
                "end_time": "5.065",
                "alternatives": [
                    {    
                ...
                        "transcript": "The amazon is the largest rain forest on the planet.",
                        "items": [
                            {
                             "start_time": "1.15",
                                "confidence": "1.0",
                                "end_time": "1.35",
                                "type": "pronunciation",
                                "content": "The"
                            },
                            ...
                            {
                                "start_time": "3.06",
                                "confidence": "0.0037",
                                "end_time": "3.38",
                                "type": "pronunciation",
                                "content": "rain"
                            },
                            {
                                "start_time": "3.38",
                                "confidence": "0.0037",
                                "end_time": "3.96",
                                "type": "pronunciation",
                                "content": "forest"
                            },

Um status no final da saída da transcrição.
```
"status": "COMPLETED"
}
```

Solicitar transcrições alternativas

Você pode solicitar transcrições alternativas usando o AWS Management Console, AWS CLI, ou AWS SDKs; veja exemplos a seguir:

Faça login no AWS Management Console.
No painel de navegação, escolha Tarefas de transcrição e selecione Criar tarefa (no canto superior direito). Isso abre a página Especificar os detalhes da tarefa.
Preencha todos os campos que você deseja incluir na página Especificar os detalhes da tarefa e selecione Próximo. Isso leva você à página Configurar tarefa - opcional.

Selecione Resultados alternativos e especifique o número máximo de resultados alternativos de transcrição que você deseja na transcrição.
Selecione Criar tarefa para executar a tarefa de transcrição.

Este exemplo usa o start-transcription-jobcomando e o ShowAlternatives parâmetro. Para ter mais informações, consulte StartTranscriptionJob e ShowAlternatives.

Observe que, se você incluir ShowAlternatives=true na solicitação, também deverá incluir MaxAlternatives.


aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--settings ShowAlternatives=true,MaxAlternatives=4

Aqui está outro exemplo usando o start-transcription-jobcomando e um corpo de solicitação que inclui transcrições alternativas.


aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://filepath/my-first-alt-transcription-job.json

O arquivo my-first-alt-transcription-job.json contém o corpo da solicitação a seguir.


{
  "TranscriptionJobName": "my-first-transcription-job",  
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
   },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "Settings": {
        "ShowAlternatives": true,
        "MaxAlternatives": 4
   }
}

O exemplo a seguir usa o AWS SDK para Python (Boto3) para solicitar transcrições alternativas usando o ShowAlternatives argumento do método start_transcription_job. Para ter mais informações, consulte StartTranscriptionJob e ShowAlternatives.

Para obter exemplos adicionais de uso do AWS SDKs, incluindo exemplos específicos de recursos, cenários e entre serviços, consulte o capítulo. Exemplos de código para o Amazon Transcribe usando AWS SDKs

Observe que, se você incluir 'ShowAlternatives':True na solicitação, também deverá incluir MaxAlternatives.


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    Settings = {
        'ShowAlternatives':True, 
        'MaxAlternatives':4
    }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Identificação do idioma de streaming

Melhorar a precisão da transcrição