Menggunakan file teks untuk membuat kosakata khusus medis - Amazon Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menggunakan file teks untuk membuat kosakata khusus medis

Untuk membuat kosakata khusus, Anda harus menyiapkan file teks yang berisi koleksi kata atau frasa. Amazon Transcribe Medis menggunakan file teks ini untuk membuat kosakata khusus yang dapat Anda gunakan untuk meningkatkan akurasi transkripsi kata atau frasa tersebut. Anda dapat membuat kosakata khusus menggunakan CreateMedicalVocabularyAPI atau konsol Amazon Transcribe Medis.

Untuk menggunakan AWS Management Console untuk membuat kosakata khusus, Anda memberikan Amazon S3 URI file teks yang berisi kata atau frasa Anda.

  1. Masuk ke AWS Management Console.

  2. Di panel navigasi, di bawah Amazon Transcribe Medis, pilih Kosakata khusus.

  3. Untuk Nama, di bawah pengaturan Kosakata, pilih nama untuk kosakata kustom Anda.

  4. Tentukan lokasi file audio atau file video Anda di Amazon S3:

    • Untuk lokasi file input Kosakata di S3 di bawah pengaturan Kosakata, tentukan Amazon S3 URI yang mengidentifikasi file teks yang akan Anda gunakan untuk membuat kosakata khusus Anda.

    • Untuk lokasi file input kosakata di S3, pilih Browse S3 untuk menelusuri file teks dan memilihnya.

  5. Pilih Buat kosakata.

Anda dapat melihat status pemrosesan kosakata khusus Anda di. AWS Management Console

Untuk membuat kosakata kustom medis (API)
  • Untuk StartTranscriptionJobAPI, tentukan yang berikut ini.

    1. Untuk LanguageCode, tentukan en-US.

    2. UntukVocabularyFileUri, tentukan Amazon S3 lokasi file teks yang Anda gunakan untuk menentukan kosakata kustom Anda.

    3. UntukVocabularyName, tentukan nama untuk kosakata kustom Anda. Nama yang Anda tentukan harus unik di dalam nama Anda Akun AWS.

Untuk melihat status pemrosesan kosakata kustom Anda, gunakan API. GetMedicalVocabulary

Berikut ini adalah contoh permintaan menggunakan AWS SDK untuk Python (Boto3) untuk membuat kosakata kustom.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary" response = transcribe.create_medical_vocabulary( VocabularyName = job_name, VocabularyFileUri = 's3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-table.txt' LanguageCode = 'en-US', ) while True: status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Untuk mengaktifkan partisi speaker dalam pekerjaan transkripsi batch ()AWS CLI
  • Jalankan kode berikut.

    aws transcribe create-medical-vocabulary \ --vocabulary-name my-first-vocabulary \ --vocabulary-file-uri s3://amzn-s3-demo-bucket/my-vocabularies/my-vocabulary-file.txt \ --language-code en-US