Mengaktifkan partisi speaker dalam transkripsi batch

Anda dapat mengaktifkan partisi speaker dalam pekerjaan transkripsi batch menggunakan StartMedicalTranscriptionJobAPI atau. AWS Management Console Ini memungkinkan Anda untuk mempartisi teks per pembicara dalam percakapan klinis-pasien dan menentukan siapa yang mengatakan apa dalam output transkripsi.

Untuk menggunakan AWS Management Console untuk mengaktifkan diarisasi speaker dalam pekerjaan transkripsi Anda, Anda mengaktifkan identifikasi audio dan kemudian partisi speaker.

Masuk ke AWS Management Console.
Di panel navigasi, di bawah Amazon Transcribe Medis, pilih Pekerjaan transkripsi.
Pilih Buat tugas.
Pada halaman Tentukan detail pekerjaan, berikan informasi tentang pekerjaan transkripsi Anda.
Pilih Berikutnya.
Aktifkan identifikasi Audio.
Untuk jenis identifikasi Audio, pilih Partisi speaker.
Untuk Jumlah speaker maksimum, masukkan jumlah speaker maksimum yang menurut Anda berbicara dalam file audio Anda.
Pilih Buat.

Untuk mengaktifkan partisi speaker menggunakan tugas transkripsi batch (API)

Untuk StartMedicalTranscriptionJobAPI, tentukan yang berikut ini.
1. UntukMedicalTranscriptionJobName, tentukan nama yang unik di Anda Akun AWS.
2. UntukLanguageCode, tentukan kode bahasa yang sesuai dengan bahasa yang digunakan dalam file audio.
3. Untuk MediaFileUri parameter Media objek, tentukan nama file audio yang ingin Anda transkripsikan.
4. UntukSpecialty, tentukan spesialisasi medis dokter yang berbicara dalam file audio.
5. Untuk Type, tentukan CONVERSATION.
6. UntukOutputBucketName, tentukan Amazon S3 ember untuk menyimpan hasil transkripsi.
7. Untuk Settings objek, tentukan yang berikut ini.
  1. ShowSpeakerLabels – true.
  2. MaxSpeakerLabels— Bilangan bulat antara 2 dan 10 untuk menunjukkan jumlah speaker yang menurut Anda berbicara dalam audio Anda.

Permintaan berikut menggunakan AWS SDK untuk Python (Boto3) untuk memulai pekerjaan transkripsi batch dari dialog pasien dokter perawatan primer dengan partisi pembicara diaktifkan.



from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
    MedicalTranscriptionJobName = job_name,
    Media={
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US',
    Specialty = 'PRIMARYCARE',
    Type = 'CONVERSATION',
    OutputBucketName = 'amzn-s3-demo-bucket',
Settings = {'ShowSpeakerLabels': True,
         'MaxSpeakerLabels': 2
         }
         )
while True:
    status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Kode contoh berikut menunjukkan hasil transkripsi dari pekerjaan transkripsi dengan partisi speaker diaktifkan.



{
    "jobName": "job ID",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "Professional answer."
            }
        ],
        "speaker_labels": {
            "speakers": 1,
            "segments": [
                {
                    "start_time": "0.000000",
                    "speaker_label": "spk_0",
                    "end_time": "1.430",
                    "items": [
                        {
                            "start_time": "0.100",
                            "speaker_label": "spk_0",
                            "end_time": "0.690"
                        },
                        {
                            "start_time": "0.690",
                            "speaker_label": "spk_0",
                            "end_time": "1.210"
                        }
                    ]
                }
            ]
        },
        "items": [
            {
                "start_time": "0.100",
                "end_time": "0.690",
                "alternatives": [
                    {
                        "confidence": "0.8162",
                        "content": "Professional"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "0.690",
                "end_time": "1.210",
                "alternatives": [
                    {
                        "confidence": "0.9939",
                        "content": "answer"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "alternatives": [
                    {
                        "content": "."
                    }
                ],
                "type": "punctuation"
            }
        ]
    },
    "status": "COMPLETED"
}

Untuk mentranskripsikan file audio percakapan antara dokter yang mempraktikkan perawatan primer dan pasien ()AWS CLI

Jalankan kode berikut.



                    
aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://example-start-command.json

Kode berikut menunjukkan isi dariexample-start-command.json.


{
    "MedicalTranscriptionJobName": "my-first-med-transcription-job",       
     "Media": {
          "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
      },
      "OutputBucketName": "amzn-s3-demo-bucket",
      "OutputKey": "my-output-files/", 
      "LanguageCode": "en-US",
      "Specialty": "PRIMARYCARE",
      "Type": "CONVERSATION",
      "Settings":{
          "ShowSpeakerLabels": true,
          "MaxSpeakerLabels": 2
        }
}

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Mengaktifkan partisi speaker

Mempartisi speaker dalam streaming waktu nyata