Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mengaktifkan partisi speaker dalam transkripsi batch
Anda dapat mengaktifkan partisi speaker dalam pekerjaan transkripsi batch menggunakan StartMedicalTranscriptionJob
API atau. AWS Management Console Ini memungkinkan Anda untuk mempartisi teks per pembicara dalam percakapan klinis-pasien dan menentukan siapa yang mengatakan apa dalam output transkripsi.
Untuk menggunakan AWS Management Console untuk mengaktifkan diarisasi speaker dalam pekerjaan transkripsi Anda, Anda mengaktifkan identifikasi audio dan kemudian partisi speaker.
-
Masuk ke AWS Management Console
. -
Di panel navigasi, di bawah Amazon Transcribe Medis, pilih Pekerjaan transkripsi.
-
Pilih Buat tugas.
-
Pada halaman Tentukan detail pekerjaan, berikan informasi tentang pekerjaan transkripsi Anda.
-
Pilih Berikutnya.
-
Aktifkan identifikasi Audio.
-
Untuk jenis identifikasi Audio, pilih Partisi speaker.
-
Untuk Jumlah speaker maksimum, masukkan jumlah speaker maksimum yang menurut Anda berbicara dalam file audio Anda.
-
Pilih Buat.
Untuk mengaktifkan partisi speaker menggunakan tugas transkripsi batch (API)
-
Untuk
StartMedicalTranscriptionJob
API, tentukan yang berikut ini.-
Untuk
MedicalTranscriptionJobName
, tentukan nama yang unik di Anda Akun AWS. -
Untuk
LanguageCode
, tentukan kode bahasa yang sesuai dengan bahasa yang digunakan dalam file audio. -
Untuk
MediaFileUri
parameterMedia
objek, tentukan nama file audio yang ingin Anda transkripsikan. -
Untuk
Specialty
, tentukan spesialisasi medis dokter yang berbicara dalam file audio. -
Untuk
Type
, tentukanCONVERSATION
. -
Untuk
OutputBucketName
, tentukan Amazon S3 ember untuk menyimpan hasil transkripsi. -
Untuk
Settings
objek, tentukan yang berikut ini.-
ShowSpeakerLabels
–true
. -
MaxSpeakerLabels
— Bilangan bulat antara 2 dan 10 untuk menunjukkan jumlah speaker yang menurut Anda berbicara dalam audio Anda.
-
-
Permintaan berikut menggunakan AWS SDK untuk Python (Boto3) untuk memulai pekerjaan transkripsi batch dari dialog pasien dokter perawatan primer dengan partisi pembicara diaktifkan.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') job_name = "my-first-transcription-job
" job_uri = "s3://amzn-s3-demo-bucket
/my-input-files
/my-media-file
.flac
" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media={ 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket
', OutputKey = 'my-output-files
/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', OutputBucketName = 'amzn-s3-demo-bucket
', Settings = {'ShowSpeakerLabels': True, 'MaxSpeakerLabels': 2 } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Kode contoh berikut menunjukkan hasil transkripsi dari pekerjaan transkripsi dengan partisi speaker diaktifkan.
{ "jobName": "job ID", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "Professional answer." } ], "speaker_labels": { "speakers": 1, "segments": [ { "start_time": "0.000000", "speaker_label": "spk_0", "end_time": "1.430", "items": [ { "start_time": "0.100", "speaker_label": "spk_0", "end_time": "0.690" }, { "start_time": "0.690", "speaker_label": "spk_0", "end_time": "1.210" } ] } ] }, "items": [ { "start_time": "0.100", "end_time": "0.690", "alternatives": [ { "confidence": "0.8162", "content": "Professional" } ], "type": "pronunciation" }, { "start_time": "0.690", "end_time": "1.210", "alternatives": [ { "confidence": "0.9939", "content": "answer" } ], "type": "pronunciation" }, { "alternatives": [ { "content": "." } ], "type": "punctuation" } ] }, "status": "COMPLETED" }
Untuk mentranskripsikan file audio percakapan antara dokter yang mempraktikkan perawatan primer dan pasien ()AWS CLI
-
Jalankan kode berikut.
aws transcribe start-transcription-job \ --region
us-west-2
\ --cli-input-json file://example-start-command
.jsonKode berikut menunjukkan isi dari
example-start-command.json
.{ "MedicalTranscriptionJobName": "
my-first-med-transcription-job
", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket
/my-input-files
/my-audio-file
.flac
" }, "OutputBucketName": "amzn-s3-demo-bucket
", "OutputKey": "my-output-files
/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }