Usar um modelo de idioma personalizado em uma transcrição em lote Usar um modelo de idioma personalizado em uma transcrição de streaming

Usar um modelo de idioma personalizado

Depois de criar o modelo de idioma personalizado, você pode incluí-lo nas solicitações de transcrição. Consulte as seções a seguir para ver exemplos.

O idioma do modelo que você está incluindo na solicitação deve corresponder ao código de idioma especificado para a mídia. Se os idiomas não corresponderem, o modelo de idioma personalizado não será aplicado à transcrição e não haverá avisos ou erros.

Usar um modelo de idioma personalizado em uma transcrição em lote

Para usar um modelo de idioma personalizado com uma transcrição em lote, veja os seguintes exemplos:

Faça login no AWS Management Console.
No painel de navegação, escolha Tarefas de transcrição e selecione Criar tarefa (no canto superior direito). Isso abre a página Especificar os detalhes da tarefa.
No painel Configurações de tarefa, em Tipo de modelo, selecione a caixa Modelo de idioma personalizado.

Você também deve selecionar um idioma de entrada no menu suspenso.
Em Seleção de modelo personalizado, escolha um modelo de idioma personalizado existente no menu suspenso ou Criar um.

Adicione a Amazon S3 localização do seu arquivo de entrada no painel Dados de entrada.
Selecione Próximo para obter opções de configuração adicionais.

Selecione Criar tarefa para executar a tarefa de transcrição.

Este exemplo usa o start-transcription-jobcomando e o ModelSettings parâmetro com o VocabularyName subparâmetro. Para ter mais informações, consulte StartTranscriptionJob e ModelSettings.


aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--model-settings LanguageModelName=my-first-language-model

Aqui está outro exemplo usando o start-transcription-jobcomando e um corpo de solicitação que inclui seu modelo de linguagem personalizado com esse trabalho.


aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://my-first-model-job.json

O arquivo my-first-model-job.json contém o seguinte corpo da solicitação.


{
  "TranscriptionJobName": "my-first-transcription-job",
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
  },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "ModelSettings": {
        "LanguageModelName": "my-first-language-model"
   }
}

Este exemplo usa o AWS SDK para Python (Boto3) para incluir um modelo de linguagem personalizado usando o ModelSettings argumento do método start_transcription_job. Para ter mais informações, consulte StartTranscriptionJob e ModelSettings.

Para obter exemplos adicionais de uso do AWS SDKs, incluindo exemplos específicos de recursos, cenários e entre serviços, consulte o capítulo. Exemplos de código para o Amazon Transcribe usando AWS SDKs


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    ModelSettings = {
        'LanguageModelName': 'my-first-language-model' 
   }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Usar um modelo de idioma personalizado em uma transcrição de streaming

Para usar um modelo de idioma personalizado com uma transcrição de streaming, veja os seguintes exemplos:

Faça login no AWS Management Console.
No painel de navegação, escolha Transcrição em tempo real. Role para baixo até Personalizações e expanda esse campo se ele estiver minimizado.
Ative o Modelo de idioma personalizado e selecione um modelo no menu suspenso.

Inclua outras configurações que deseja aplicar ao fluxo.
Agora está tudo pronto para transcrever seu fluxo. Selecione Iniciar transmissão e comece a falar. Para finalizar o ditado, selecione Interromper transmissão.

Este exemplo cria uma solicitação HTTP/2 que inclui seu modelo de idioma personalizado. Para obter mais informações sobre como usar o streaming HTTP/2 com Amazon Transcribe, consulte. Configurar um fluxo de HTTP/2 Para obter mais detalhes sobre parâmetros e cabeçalhos específicos de Amazon Transcribe, consulte StartStreamTranscription.


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000      
x-amzn-transcribe-language-model-name: my-first-language-model
transfer-encoding: chunked

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações AWS da API estão listados na seção Parâmetros comuns.

Este exemplo cria um URL pré-assinado que aplica seu modelo de linguagem personalizado a um WebSocket stream. Quebras de linha foram adicionadas para uma melhor leitura. Para obter mais informações sobre o uso de WebSocket fluxos com Amazon Transcribe, consulteConfigurando um WebSocket stream. Para obter mais detalhes sobre os parâmetros, consulte StartStreamTranscription.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&language-code=en-US
&media-encoding=flac
&sample-rate=16000    
&language-model-name=my-first-language-model

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações AWS da API estão listados na seção Parâmetros comuns.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Criar um modelo de idioma personalizado

Filtrar palavras