Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mentranskripsikan file audio menggunakan kosakata khusus medis
Gunakan StartMedicalTranscriptionJob
atauAWS Management Console untuk memulai pekerjaan transkripsi yang menggunakan kosakata khusus untuk meningkatkan akurasi transkripsi.
-
Masuk ke AWS Management Console
. -
Dalam panel navigasi, di bawahAmazon Transcribe Medis, pilih Pekerjaan transkripsi.
-
Pilih Buat tugas.
-
Pada halaman Tentukan detail pekerjaan, berikan informasi tentang pekerjaan transkripsi Anda.
-
Pilih Selanjutnya.
-
Di bawah Kustomisasi, aktifkan Kosakata khusus.
-
Di bawah Pemilihan kosakata, pilih kosakata khusus.
-
Pilih Create (Buat).
Untuk mengaktifkan partisi speaker dalam file audio menggunakan pekerjaan transkripsi batch (API)
-
Untuk
StartMedicalTranscriptionJob
API, tentukan yang berikut ini.-
Untuk
MedicalTranscriptionJobName
, tentukan nama yang unik di AndaAkun AWS. -
Untuk
LanguageCode
, tentukan kode bahasa yang sesuai dengan bahasa yang digunakan dalam file audio Anda dan bahasa filter kosakata Anda. -
Untuk
MediaFileUri
parameterMedia
objek, tentukan nama file audio yang ingin Anda transkripsikan. -
Untuk
Specialty
, tentukan spesialisasi medis dokter yang berbicara dalam file audio. -
Untuk
Type
, tentukan apakah file audio adalah percakapan atau dikte. -
Untuk
OutputBucketName
, tentukanAmazon S3 bucket untuk menyimpan hasil transkripsi. -
Untuk
Settings
objek, tentukan yang berikut ini.-
VocabularyName
- nama kosakata khusus Anda.
-
-
Permintaan berikut menggunakanAWS SDK for Python (Boto3) untuk memulai pekerjaan transkripsi batch dengan kosakata khusus.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') job_name = "my-first-med-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET
', OutputKey = 'my-output-files
/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', Settings = { 'VocabularyName': 'example-med-custom-vocab' } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)