Mengaktifkan partisi speaker dalam transkripsi batch - Amazon Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mengaktifkan partisi speaker dalam transkripsi batch

Anda dapat mengaktifkan partisi speaker dalam pekerjaan transkripsi batch menggunakan StartMedicalTranscriptionJobAPI atau. AWS Management Console Ini memungkinkan Anda untuk mempartisi teks per pembicara dalam percakapan klinis-pasien dan menentukan siapa yang mengatakan apa dalam output transkripsi.

Untuk menggunakan AWS Management Console untuk mengaktifkan diarisasi speaker dalam pekerjaan transkripsi Anda, Anda mengaktifkan identifikasi audio dan kemudian partisi speaker.

  1. Masuk ke AWS Management Console.

  2. Di panel navigasi, di bawah Amazon Transcribe Medis, pilih Pekerjaan transkripsi.

  3. Pilih Buat tugas.

  4. Pada halaman Tentukan detail pekerjaan, berikan informasi tentang pekerjaan transkripsi Anda.

  5. Pilih Berikutnya.

  6. Aktifkan identifikasi Audio.

  7. Untuk jenis identifikasi Audio, pilih Partisi speaker.

  8. Untuk Jumlah speaker maksimum, masukkan jumlah speaker maksimum yang menurut Anda berbicara dalam file audio Anda.

  9. Pilih Buat.

Untuk mengaktifkan partisi speaker menggunakan tugas transkripsi batch (API)
  • Untuk StartMedicalTranscriptionJobAPI, tentukan yang berikut ini.

    1. UntukMedicalTranscriptionJobName, tentukan nama yang unik di Anda Akun AWS.

    2. UntukLanguageCode, tentukan kode bahasa yang sesuai dengan bahasa yang digunakan dalam file audio.

    3. Untuk MediaFileUri parameter Media objek, tentukan nama file audio yang ingin Anda transkripsikan.

    4. UntukSpecialty, tentukan spesialisasi medis dokter yang berbicara dalam file audio.

    5. Untuk Type, tentukan CONVERSATION.

    6. UntukOutputBucketName, tentukan Amazon S3 ember untuk menyimpan hasil transkripsi.

    7. Untuk Settings objek, tentukan yang berikut ini.

      1. ShowSpeakerLabelstrue.

      2. MaxSpeakerLabels— Bilangan bulat antara 2 dan 10 untuk menunjukkan jumlah speaker yang menurut Anda berbicara dalam audio Anda.

Permintaan berikut menggunakan AWS SDK untuk Python (Boto3) untuk memulai pekerjaan transkripsi batch dari dialog pasien dokter perawatan primer dengan partisi pembicara diaktifkan.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media={ 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', OutputBucketName = 'amzn-s3-demo-bucket', Settings = {'ShowSpeakerLabels': True, 'MaxSpeakerLabels': 2 } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

Kode contoh berikut menunjukkan hasil transkripsi dari pekerjaan transkripsi dengan partisi speaker diaktifkan.

{ "jobName": "job ID", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "Professional answer." } ], "speaker_labels": { "speakers": 1, "segments": [ { "start_time": "0.000000", "speaker_label": "spk_0", "end_time": "1.430", "items": [ { "start_time": "0.100", "speaker_label": "spk_0", "end_time": "0.690" }, { "start_time": "0.690", "speaker_label": "spk_0", "end_time": "1.210" } ] } ] }, "items": [ { "start_time": "0.100", "end_time": "0.690", "alternatives": [ { "confidence": "0.8162", "content": "Professional" } ], "type": "pronunciation" }, { "start_time": "0.690", "end_time": "1.210", "alternatives": [ { "confidence": "0.9939", "content": "answer" } ], "type": "pronunciation" }, { "alternatives": [ { "content": "." } ], "type": "punctuation" } ] }, "status": "COMPLETED" }
Untuk mentranskripsikan file audio percakapan antara dokter yang mempraktikkan perawatan primer dan pasien ()AWS CLI
  • Jalankan kode berikut.

    aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://example-start-command.json

    Kode berikut menunjukkan isi dariexample-start-command.json.

    { "MedicalTranscriptionJobName": "my-first-med-transcription-job", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" }, "OutputBucketName": "amzn-s3-demo-bucket", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }