Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Attivazione del partizionamento dei diffusori nelle trascrizioni in batch
È possibile abilitare il partizionamento degli altoparlanti in un processo di trascrizione batch utilizzando l'StartMedicalTranscriptionJob
API o ilAWS Management Console. Ciò consente di suddividere il testo per oratore in una conversazione medico-paziente e determinare chi ha detto cosa nell'output della trascrizione.
Per utilizzare l'opzioneAWS Management Console per abilitare la diarizzazione dei diffusori nel processo di trascrizione, è necessario abilitare l'identificazione dell'audio e quindi il partizionamento degli altoparlanti.
-
Accedere alla AWS Management Console
. -
Nel riquadro di navigazione, inAmazon Transcribe Medico, scegli Lavori di trascrizione.
-
Scegli Create job (Crea processo).
-
Nella pagina Specifica i dettagli del lavoro, fornisci informazioni sul tuo lavoro di trascrizione.
-
Seleziona Successivo.
-
Abilita l'identificazione audio.
-
Per il tipo di identificazione audio, scegli Partizionamento altoparlanti.
-
In Numero massimo di altoparlanti, inserisci il numero massimo di altoparlanti che pensi stiano parlando nel tuo file audio.
-
Seleziona Create (Crea).
Per abilitare il partizionamento degli altoparlanti utilizzando un processo di trascrizione in batch (API)
-
Per l'
StartMedicalTranscriptionJob
API, specifica quanto segue.-
Per
MedicalTranscriptionJobName
, specifica un nome univoco nel tuoAccount AWS. -
Infatti
LanguageCode
, specifica il codice della lingua che corrisponde alla lingua parlata nel file audio. -
Per il
MediaFileUri
parametro dell'Media
oggetto, specificate il nome del file audio che desiderate trascrivere. -
Infatti
Specialty
, specifica la specialità medica del medico che parla nel file audio. -
Per
Type
, specificareCONVERSATION
. -
Per
OutputBucketName
, specifica ilAmazon S3 bucket in cui memorizzare i risultati della trascrizione. -
Per l'
Settings
oggetto, specificare quanto segue.-
ShowSpeakerLabels
–true
. -
MaxSpeakerLabels
— Un numero intero compreso tra 2 e 10 per indicare il numero di altoparlanti che ritieni stiano parlando nel tuo audio.
-
-
La seguente richiesta utilizza il comandoAWS SDK for Python (Boto3) per avviare un processo di trascrizione in batch del dialogo con un paziente di un medico di base con il partizionamento degli altoparlanti abilitato.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') job_name = "my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media={ 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET
', OutputKey = 'my-output-files
/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', OutputBucketName = 'DOC-EXAMPLE-BUCKET
', Settings = {'ShowSpeakerLabels': True, 'MaxSpeakerLabels': 2 } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Il codice di esempio seguente mostra i risultati di trascrizione di un processo di trascrizione con il partizionamento degli altoparlanti abilitato.
{ "jobName": "job ID", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "Professional answer." } ], "speaker_labels": { "speakers": 1, "segments": [ { "start_time": "0.000000", "speaker_label": "spk_0", "end_time": "1.430", "items": [ { "start_time": "0.100", "speaker_label": "spk_0", "end_time": "0.690" }, { "start_time": "0.690", "speaker_label": "spk_0", "end_time": "1.210" } ] } ] }, "items": [ { "start_time": "0.100", "end_time": "0.690", "alternatives": [ { "confidence": "0.8162", "content": "Professional" } ], "type": "pronunciation" }, { "start_time": "0.690", "end_time": "1.210", "alternatives": [ { "confidence": "0.9939", "content": "answer" } ], "type": "pronunciation" }, { "alternatives": [ { "content": "." } ], "type": "punctuation" } ] }, "status": "COMPLETED" }
Per trascrivere un file audio di una conversazione tra un medico che pratica le cure primarie e un paziente (AWS CLI)
-
Eseguire il seguente codice.
aws transcribe start-transcription-job \ --region
us-west-2
\ --cli-input-json file://example-start-command
.jsonIl seguente codice mostra il contenuto di
example-start-command.json
.{ "MedicalTranscriptionJobName": "
my-first-med-transcription-job
", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-audio-file
.flac
" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET
", "OutputKey": "my-output-files
/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }