Attivazione del partizionamento dei diffusori nelle trascrizioni in batch - Amazon Transcribe

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Attivazione del partizionamento dei diffusori nelle trascrizioni in batch

È possibile abilitare il partizionamento degli altoparlanti in un processo di trascrizione batch utilizzando l'StartMedicalTranscriptionJobAPI o ilAWS Management Console. Ciò consente di suddividere il testo per oratore in una conversazione medico-paziente e determinare chi ha detto cosa nell'output della trascrizione.

Per utilizzare l'opzioneAWS Management Console per abilitare la diarizzazione dei diffusori nel processo di trascrizione, è necessario abilitare l'identificazione dell'audio e quindi il partizionamento degli altoparlanti.

  1. Accedere alla AWS Management Console.

  2. Nel riquadro di navigazione, inAmazon Transcribe Medico, scegli Lavori di trascrizione.

  3. Scegli Create job (Crea processo).

  4. Nella pagina Specifica i dettagli del lavoro, fornisci informazioni sul tuo lavoro di trascrizione.

  5. Seleziona Successivo.

  6. Abilita l'identificazione audio.

  7. Per il tipo di identificazione audio, scegli Partizionamento altoparlanti.

  8. In Numero massimo di altoparlanti, inserisci il numero massimo di altoparlanti che pensi stiano parlando nel tuo file audio.

  9. Seleziona Create (Crea).

Per abilitare il partizionamento degli altoparlanti utilizzando un processo di trascrizione in batch (API)
  • Per l'StartMedicalTranscriptionJobAPI, specifica quanto segue.

    1. PerMedicalTranscriptionJobName, specifica un nome univoco nel tuoAccount AWS.

    2. InfattiLanguageCode, specifica il codice della lingua che corrisponde alla lingua parlata nel file audio.

    3. Per ilMediaFileUri parametro dell'Mediaoggetto, specificate il nome del file audio che desiderate trascrivere.

    4. InfattiSpecialty, specifica la specialità medica del medico che parla nel file audio.

    5. Per Type, specificare CONVERSATION.

    6. PerOutputBucketName, specifica ilAmazon S3 bucket in cui memorizzare i risultati della trascrizione.

    7. Per l'Settingsoggetto, specificare quanto segue.

      1. ShowSpeakerLabelstrue.

      2. MaxSpeakerLabels— Un numero intero compreso tra 2 e 10 per indicare il numero di altoparlanti che ritieni stiano parlando nel tuo audio.

La seguente richiesta utilizza il comandoAWS SDK for Python (Boto3) per avviare un processo di trascrizione in batch del dialogo con un paziente di un medico di base con il partizionamento degli altoparlanti abilitato.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media={ 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', OutputBucketName = 'DOC-EXAMPLE-BUCKET', Settings = {'ShowSpeakerLabels': True, 'MaxSpeakerLabels': 2 } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

Il codice di esempio seguente mostra i risultati di trascrizione di un processo di trascrizione con il partizionamento degli altoparlanti abilitato.

{ "jobName": "job ID", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "Professional answer." } ], "speaker_labels": { "speakers": 1, "segments": [ { "start_time": "0.000000", "speaker_label": "spk_0", "end_time": "1.430", "items": [ { "start_time": "0.100", "speaker_label": "spk_0", "end_time": "0.690" }, { "start_time": "0.690", "speaker_label": "spk_0", "end_time": "1.210" } ] } ] }, "items": [ { "start_time": "0.100", "end_time": "0.690", "alternatives": [ { "confidence": "0.8162", "content": "Professional" } ], "type": "pronunciation" }, { "start_time": "0.690", "end_time": "1.210", "alternatives": [ { "confidence": "0.9939", "content": "answer" } ], "type": "pronunciation" }, { "alternatives": [ { "content": "." } ], "type": "punctuation" } ] }, "status": "COMPLETED" }
Per trascrivere un file audio di una conversazione tra un medico che pratica le cure primarie e un paziente (AWS CLI)
  • Eseguire il seguente codice.

    aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://example-start-command.json

    Il seguente codice mostra il contenuto diexample-start-command.json.

    { "MedicalTranscriptionJobName": "my-first-med-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }