Attivazione del partizionamento dei diffusori nelle trascrizioni in batch

È possibile abilitare il partizionamento degli altoparlanti in un processo di trascrizione batch utilizzando l'StartMedicalTranscriptionJobAPI o ilAWS Management Console. Ciò consente di suddividere il testo per oratore in una conversazione medico-paziente e determinare chi ha detto cosa nell'output della trascrizione.

Per utilizzare l'opzioneAWS Management Console per abilitare la diarizzazione dei diffusori nel processo di trascrizione, è necessario abilitare l'identificazione dell'audio e quindi il partizionamento degli altoparlanti.

Accedere alla AWS Management Console.
Nel riquadro di navigazione, inAmazon Transcribe Medico, scegli Lavori di trascrizione.
Scegli Create job (Crea processo).
Nella pagina Specifica i dettagli del lavoro, fornisci informazioni sul tuo lavoro di trascrizione.
Seleziona Successivo.
Abilita l'identificazione audio.
Per il tipo di identificazione audio, scegli Partizionamento altoparlanti.
In Numero massimo di altoparlanti, inserisci il numero massimo di altoparlanti che pensi stiano parlando nel tuo file audio.
Seleziona Create (Crea).

Per abilitare il partizionamento degli altoparlanti utilizzando un processo di trascrizione in batch (API)

Per l'StartMedicalTranscriptionJobAPI, specifica quanto segue.
1. PerMedicalTranscriptionJobName, specifica un nome univoco nel tuoAccount AWS.
2. InfattiLanguageCode, specifica il codice della lingua che corrisponde alla lingua parlata nel file audio.
3. Per ilMediaFileUri parametro dell'Mediaoggetto, specificate il nome del file audio che desiderate trascrivere.
4. InfattiSpecialty, specifica la specialità medica del medico che parla nel file audio.
5. Per Type, specificare CONVERSATION.
6. PerOutputBucketName, specifica ilAmazon S3 bucket in cui memorizzare i risultati della trascrizione.
7. Per l'Settingsoggetto, specificare quanto segue.
  1. ShowSpeakerLabels – true.
  2. MaxSpeakerLabels— Un numero intero compreso tra 2 e 10 per indicare il numero di altoparlanti che ritieni stiano parlando nel tuo audio.

La seguente richiesta utilizza il comandoAWS SDK for Python (Boto3) per avviare un processo di trascrizione in batch del dialogo con un paziente di un medico di base con il partizionamento degli altoparlanti abilitato.



from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
    MedicalTranscriptionJobName = job_name,
    Media={
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'DOC-EXAMPLE-BUCKET',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US',
    Specialty = 'PRIMARYCARE',
    Type = 'CONVERSATION',
    OutputBucketName = 'DOC-EXAMPLE-BUCKET',
Settings = {'ShowSpeakerLabels': True,
         'MaxSpeakerLabels': 2
         }
         )
while True:
    status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Il codice di esempio seguente mostra i risultati di trascrizione di un processo di trascrizione con il partizionamento degli altoparlanti abilitato.



{
    "jobName": "job ID",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "Professional answer."
            }
        ],
        "speaker_labels": {
            "speakers": 1,
            "segments": [
                {
                    "start_time": "0.000000",
                    "speaker_label": "spk_0",
                    "end_time": "1.430",
                    "items": [
                        {
                            "start_time": "0.100",
                            "speaker_label": "spk_0",
                            "end_time": "0.690"
                        },
                        {
                            "start_time": "0.690",
                            "speaker_label": "spk_0",
                            "end_time": "1.210"
                        }
                    ]
                }
            ]
        },
        "items": [
            {
                "start_time": "0.100",
                "end_time": "0.690",
                "alternatives": [
                    {
                        "confidence": "0.8162",
                        "content": "Professional"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "0.690",
                "end_time": "1.210",
                "alternatives": [
                    {
                        "confidence": "0.9939",
                        "content": "answer"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "alternatives": [
                    {
                        "content": "."
                    }
                ],
                "type": "punctuation"
            }
        ]
    },
    "status": "COMPLETED"
}

Per trascrivere un file audio di una conversazione tra un medico che pratica le cure primarie e un paziente (AWS CLI)

Eseguire il seguente codice.



                    
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://example-start-command.json

Il seguente codice mostra il contenuto diexample-start-command.json.


{
    "MedicalTranscriptionJobName": "my-first-med-transcription-job",       
     "Media": {
          "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac"
      },
      "OutputBucketName": "DOC-EXAMPLE-BUCKET",
      "OutputKey": "my-output-files/", 
      "LanguageCode": "en-US",
      "Specialty": "PRIMARYCARE",
      "Type": "CONVERSATION",
      "Settings":{
          "ShowSpeakerLabels": true,
          "MaxSpeakerLabels": 2
        }
}

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Abilitazione del partizionamento dei diffusori

Partizionamento degli altoparlanti in stream in tempo reale