Habilitando o particionamento de alto-falantes em transcrições em lote - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Habilitando o particionamento de alto-falantes em transcrições em lote

Você pode ativar o particionamento de alto-falantes em um trabalho de transcrição em lote usando a StartMedicalTranscriptionJobAPI ouAWS Management Console o. Isso permite que você particione o texto por palestrante em uma conversa médico-paciente e determine quem disse o quê na saída da transcrição.

Para usar oAWS Management Console para habilitar a diarização do alto-falante em seu trabalho de transcrição, você ativa a identificação de áudio e, em seguida, o particionamento do alto-falante.

  1. Faça login no AWS Management Console.

  2. No painel de navegação, emAmazon Transcribe Principal, escolha Trabalhos de transcrição.

  3. Escolha Create job (Criar trabalho).

  4. Na página Especificar detalhes do trabalho, forneça informações sobre seu trabalho de transcrição.

  5. Escolha Próximo.

  6. Ative a identificação de áudio.

  7. Para Tipo de identificação de áudio, escolha Particionamento de alto-falante.

  8. Em Número máximo de alto-falantes, insira o número máximo de alto-falantes que você acha que estão falando em seu arquivo de áudio.

  9. Escolha Create (Criar).

Para habilitar o particionamento de alto-falantes usando um trabalho de transcrição em lote (API)
  • Para a StartMedicalTranscriptionJobAPI, especifique o seguinte.

    1. ParaMedicalTranscriptionJobName, especifique um nome exclusivo em seuConta da AWS.

    2. ParaLanguageCode, especifique o código do idioma que corresponde ao idioma falado no arquivo de áudio.

    3. Para oMediaFileUri parâmetro doMedia objeto, especifique o nome do arquivo de áudio que você deseja transcrever.

    4. ParaSpecialty, especifique a especialidade médica do médico que fala no arquivo de áudio.

    5. Para Type, especifique CONVERSATION.

    6. ParaOutputBucketName, especifique oAmazon S3 bucket para armazenar os resultados da transcrição.

    7. Para oSettings objeto, especifique o seguinte.

      1. ShowSpeakerLabelstrue.

      2. MaxSpeakerLabels— Um número inteiro entre 2 e 10 para indicar o número de alto-falantes que você acha que estão falando em seu áudio.

A solicitação a seguir usa oAWS SDK for Python (Boto3) para iniciar um trabalho de transcrição em lote de um diálogo com o paciente de um médico de cuidados primários com a partição de alto-falantes ativada.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media={ 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', OutputBucketName = 'DOC-EXAMPLE-BUCKET', Settings = {'ShowSpeakerLabels': True, 'MaxSpeakerLabels': 2 } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

O código de exemplo a seguir mostra os resultados da transcrição de um trabalho de transcrição com o particionamento de alto-falantes ativado.

{ "jobName": "job ID", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "Professional answer." } ], "speaker_labels": { "speakers": 1, "segments": [ { "start_time": "0.000000", "speaker_label": "spk_0", "end_time": "1.430", "items": [ { "start_time": "0.100", "speaker_label": "spk_0", "end_time": "0.690" }, { "start_time": "0.690", "speaker_label": "spk_0", "end_time": "1.210" } ] } ] }, "items": [ { "start_time": "0.100", "end_time": "0.690", "alternatives": [ { "confidence": "0.8162", "content": "Professional" } ], "type": "pronunciation" }, { "start_time": "0.690", "end_time": "1.210", "alternatives": [ { "confidence": "0.9939", "content": "answer" } ], "type": "pronunciation" }, { "alternatives": [ { "content": "." } ], "type": "punctuation" } ] }, "status": "COMPLETED" }
Para transcrever um arquivo de áudio de uma conversa entre um médico que pratica cuidados primários e um paciente (AWS CLI)
  • Execute o código a seguir.

    aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://example-start-command.json

    O código a seguir mostra o conteúdo deexample-start-command.json.

    { "MedicalTranscriptionJobName": "my-first-med-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }