As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Habilitando o particionamento de alto-falantes em transcrições em lote
Você pode ativar o particionamento de alto-falantes em um trabalho de transcrição em lote usando a StartMedicalTranscriptionJob
API ouAWS Management Console o. Isso permite que você particione o texto por palestrante em uma conversa médico-paciente e determine quem disse o quê na saída da transcrição.
Para usar oAWS Management Console para habilitar a diarização do alto-falante em seu trabalho de transcrição, você ativa a identificação de áudio e, em seguida, o particionamento do alto-falante.
-
Faça login no AWS Management Console
. -
No painel de navegação, emAmazon Transcribe Principal, escolha Trabalhos de transcrição.
-
Escolha Create job (Criar trabalho).
-
Na página Especificar detalhes do trabalho, forneça informações sobre seu trabalho de transcrição.
-
Escolha Próximo.
-
Ative a identificação de áudio.
-
Para Tipo de identificação de áudio, escolha Particionamento de alto-falante.
-
Em Número máximo de alto-falantes, insira o número máximo de alto-falantes que você acha que estão falando em seu arquivo de áudio.
-
Escolha Create (Criar).
Para habilitar o particionamento de alto-falantes usando um trabalho de transcrição em lote (API)
-
Para a
StartMedicalTranscriptionJob
API, especifique o seguinte.-
Para
MedicalTranscriptionJobName
, especifique um nome exclusivo em seuConta da AWS. -
Para
LanguageCode
, especifique o código do idioma que corresponde ao idioma falado no arquivo de áudio. -
Para o
MediaFileUri
parâmetro doMedia
objeto, especifique o nome do arquivo de áudio que você deseja transcrever. -
Para
Specialty
, especifique a especialidade médica do médico que fala no arquivo de áudio. -
Para
Type
, especifiqueCONVERSATION
. -
Para
OutputBucketName
, especifique oAmazon S3 bucket para armazenar os resultados da transcrição. -
Para o
Settings
objeto, especifique o seguinte.-
ShowSpeakerLabels
–true
. -
MaxSpeakerLabels
— Um número inteiro entre 2 e 10 para indicar o número de alto-falantes que você acha que estão falando em seu áudio.
-
-
A solicitação a seguir usa oAWS SDK for Python (Boto3) para iniciar um trabalho de transcrição em lote de um diálogo com o paciente de um médico de cuidados primários com a partição de alto-falantes ativada.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') job_name = "my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media={ 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET
', OutputKey = 'my-output-files
/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', OutputBucketName = 'DOC-EXAMPLE-BUCKET
', Settings = {'ShowSpeakerLabels': True, 'MaxSpeakerLabels': 2 } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
O código de exemplo a seguir mostra os resultados da transcrição de um trabalho de transcrição com o particionamento de alto-falantes ativado.
{ "jobName": "job ID", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "Professional answer." } ], "speaker_labels": { "speakers": 1, "segments": [ { "start_time": "0.000000", "speaker_label": "spk_0", "end_time": "1.430", "items": [ { "start_time": "0.100", "speaker_label": "spk_0", "end_time": "0.690" }, { "start_time": "0.690", "speaker_label": "spk_0", "end_time": "1.210" } ] } ] }, "items": [ { "start_time": "0.100", "end_time": "0.690", "alternatives": [ { "confidence": "0.8162", "content": "Professional" } ], "type": "pronunciation" }, { "start_time": "0.690", "end_time": "1.210", "alternatives": [ { "confidence": "0.9939", "content": "answer" } ], "type": "pronunciation" }, { "alternatives": [ { "content": "." } ], "type": "punctuation" } ] }, "status": "COMPLETED" }
Para transcrever um arquivo de áudio de uma conversa entre um médico que pratica cuidados primários e um paciente (AWS CLI)
-
Execute o código a seguir.
aws transcribe start-transcription-job \ --region
us-west-2
\ --cli-input-json file://example-start-command
.jsonO código a seguir mostra o conteúdo de
example-start-command.json
.{ "MedicalTranscriptionJobName": "
my-first-med-transcription-job
", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-audio-file
.flac
" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET
", "OutputKey": "my-output-files
/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }