Mentranskripsikan file audio menggunakan kosakata khusus medis - Amazon Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mentranskripsikan file audio menggunakan kosakata khusus medis

Gunakan StartMedicalTranscriptionJobatauAWS Management Console untuk memulai pekerjaan transkripsi yang menggunakan kosakata khusus untuk meningkatkan akurasi transkripsi.

  1. Masuk ke AWS Management Console.

  2. Dalam panel navigasi, di bawahAmazon Transcribe Medis, pilih Pekerjaan transkripsi.

  3. Pilih Buat tugas.

  4. Pada halaman Tentukan detail pekerjaan, berikan informasi tentang pekerjaan transkripsi Anda.

  5. Pilih Selanjutnya.

  6. Di bawah Kustomisasi, aktifkan Kosakata khusus.

  7. Di bawah Pemilihan kosakata, pilih kosakata khusus.

  8. Pilih Create (Buat).

Untuk mengaktifkan partisi speaker dalam file audio menggunakan pekerjaan transkripsi batch (API)
  • Untuk StartMedicalTranscriptionJobAPI, tentukan yang berikut ini.

    1. UntukMedicalTranscriptionJobName, tentukan nama yang unik di AndaAkun AWS.

    2. UntukLanguageCode, tentukan kode bahasa yang sesuai dengan bahasa yang digunakan dalam file audio Anda dan bahasa filter kosakata Anda.

    3. UntukMediaFileUri parameterMedia objek, tentukan nama file audio yang ingin Anda transkripsikan.

    4. UntukSpecialty, tentukan spesialisasi medis dokter yang berbicara dalam file audio.

    5. UntukType, tentukan apakah file audio adalah percakapan atau dikte.

    6. UntukOutputBucketName, tentukanAmazon S3 bucket untuk menyimpan hasil transkripsi.

    7. UntukSettings objek, tentukan yang berikut ini.

      1. VocabularyName- nama kosakata khusus Anda.

Permintaan berikut menggunakanAWS SDK for Python (Boto3) untuk memulai pekerjaan transkripsi batch dengan kosakata khusus.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-med-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', Settings = { 'VocabularyName': 'example-med-custom-vocab' } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)