Menggunakan file teks untuk membuat kosakata khusus medis

Untuk membuat kosakata khusus, Anda harus menyiapkan file teks yang berisi koleksi kata atau frasa. Amazon Transcribe Medis menggunakan file teks ini untuk membuat kosakata khusus yang dapat Anda gunakan untuk meningkatkan akurasi transkripsi kata atau frasa tersebut. Anda dapat membuat kosakata khusus menggunakan CreateMedicalVocabularyAPI atau konsol Amazon Transcribe Medis.

Untuk menggunakan AWS Management Console untuk membuat kosakata khusus, Anda memberikan Amazon S3 URI file teks yang berisi kata atau frasa Anda.

Masuk ke AWS Management Console.
Di panel navigasi, di bawah Amazon Transcribe Medis, pilih Kosakata khusus.
Untuk Nama, di bawah pengaturan Kosakata, pilih nama untuk kosakata kustom Anda.
Tentukan lokasi file audio atau file video Anda di Amazon S3:
- Untuk lokasi file input Kosakata di S3 di bawah pengaturan Kosakata, tentukan Amazon S3 URI yang mengidentifikasi file teks yang akan Anda gunakan untuk membuat kosakata khusus Anda.
- Untuk lokasi file input kosakata di S3, pilih Browse S3 untuk menelusuri file teks dan memilihnya.
Pilih Buat kosakata.

Anda dapat melihat status pemrosesan kosakata khusus Anda di. AWS Management Console

Untuk membuat kosakata kustom medis (API)

Untuk StartTranscriptionJobAPI, tentukan yang berikut ini.
1. Untuk LanguageCode, tentukan en-US.
2. UntukVocabularyFileUri, tentukan Amazon S3 lokasi file teks yang Anda gunakan untuk menentukan kosakata kustom Anda.
3. UntukVocabularyName, tentukan nama untuk kosakata kustom Anda. Nama yang Anda tentukan harus unik di dalam nama Anda Akun AWS.

Untuk melihat status pemrosesan kosakata kustom Anda, gunakan API. GetMedicalVocabulary

Berikut ini adalah contoh permintaan menggunakan AWS SDK untuk Python (Boto3) untuk membuat kosakata kustom.



from __future__ import print_function
import time
import boto3  
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_medical_vocabulary(
    VocabularyName = job_name,
    VocabularyFileUri = 's3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt'
    LanguageCode = 'en-US',
  )
  
while True:
    status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Untuk mengaktifkan partisi speaker dalam pekerjaan transkripsi batch ()AWS CLI

Jalankan kode berikut.



aws transcribe create-medical-vocabulary \
--vocabulary-name my-first-vocabulary \ 
--vocabulary-file-uri s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-file.txt \
--language-code en-US

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Membuat file teks untuk kosakata khusus medis Anda

Mentranskripsikan file audio menggunakan kosakata khusus medis