Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Membuat file teks untuk kosakata kustom medis Anda
Untuk membuat kosakata khusus, Anda membuat file teks yang ada dalam format UTF-8. Dalam file ini, Anda membuat tabel empat kolom, dengan setiap kolom menentukan bidang. Setiap bidang memberi tahuAmazon Transcribe Medis bagaimana istilah khusus domain diucapkan atau cara menampilkan istilah ini dalam transkripsi Anda. Anda menyimpan file teks yang berisi bidang ini dalamAmazon S3 bucket.
Memahami cara memformat file teks Anda
Untuk membuat kosakata kustom medis, Anda memasukkan nama kolom sebagai baris header. Anda memasukkan nilai untuk setiap kolom di bawah baris header.
Berikut ini adalah nama-nama dari empat kolom tabel:
-
Phrase
- kolom diperlukan, nilai yang dibutuhkan -
IPA
- kolom diperlukan, nilai dapat opsional -
SoundsLike
- kolom diperlukan, nilai dapat opsional -
DisplayAs
- kolom diperlukan, nilai dapat opsional
Saat membuat kosakata khusus, pastikan bahwa Anda:
-
Pisahkan setiap kolom dengan satu karakter Tab. Amazon Transcribemelempar pesan kesalahan jika Anda mencoba memisahkan kolom dengan spasi atau beberapa karakter Tab.
-
Pastikan bahwa tidak ada spasi tambahan atau spasi putih setelah setiap nilai dalam kolom.
Pastikan nilai yang Anda masukkan untuk setiap kolom:
-
Memiliki kurang dari 256 karakter, termasuk tanda hubung
-
Gunakan hanya karakter dari set karakter yang diizinkan, lihatSet karakter untukAmazon Transcribe Medis.
Memasukkan nilai untuk kolom tabel
Informasi berikut menunjukkan kepada Anda cara menentukan nilai untuk empat kolom tabel:
-
Phrase
— Kata atau frasa yang harus dikenali. Anda harus memasukkan nilai di kolom ini.Jika entri adalah frasa, pisahkan kata-kata dengan tanda hubung (-). Misalnya, masukkan
cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy
sebagaicerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy
.Masukkan akronim atau kata lain yang hurufnya harus diucapkan secara individual sebagai huruf tunggal diikuti oleh titik-titik, seperti
D.N.A.
atauS.T.E.M.I.
. Untuk memasukkan bentuk jamak dari akronim, seperti “STEMIS,” pisahkan “s” dari akronim dengan tanda hubung:S.T.E.M.I-s
"" Anda dapat menggunakan huruf besar atau kecil untuk akronim.Phrase
Kolom diperlukan. Anda dapat menggunakan salah satu karakter yang diizinkan untuk bahasa input. Untuk karakter yang diizinkan, lihatSet karakter untukAmazon Transcribe Medis. Jika Anda tidak menentukanDisplayAs
kolom,Amazon Transcribe Medis menggunakan kontenPhrase
kolom di file keluaran. -
IPA
(kolom diperlukan, nilai bisa opsional) - Untuk menentukan pengucapan kata atau frasa, Anda dapat memasukkan karakter di Alfabet Fonetik Internasional (IPA)di kolom ini. IPA
Kolom tidak dapat berisi spasi utama atau belakang, dan Anda harus menggunakan satu spasi untuk memisahkan setiap fonem dalam input. Misalnya, dalam bahasa Inggris Anda akan memasukkan frasaacute-respiratory-distress-syndrome
sebagaiə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m
. Anda akan memasukkan frasaA.L.L.
sebagaieɪ ɛ l ɛ l
.Bahkan jika Anda tidak menentukan isi
IPA
kolom, Anda harus menyertakanIPA
kolom kosong. Jika Anda menyertakan nilai diIPA
kolom, Anda tidak dapat memberikan nilai untukSoundsLike
kolom.Untuk daftar karakter IPA yang diizinkan untuk bahasa tertentu, lihatSet karakter untukAmazon Transcribe Medis. Bahasa Inggris AS adalah satu-satunya bahasa yang tersedia diAmazon Transcribe Medis.
-
SoundsLike
(kolom diperlukan, nilai dapat opsional) - Anda dapat memecah kata atau frasa menjadi segmen yang lebih kecil dan memberikan pengucapan untuk setiap segmen menggunakan ortografi standar bahasa untuk meniru cara kata itu terdengar. Misalnya, Anda dapat memberikan petunjuk pengucapan untuk frasacerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy
seperti ini:sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy
. Petunjuk untuk frasaatrioventricular-nodal-reentrant-tachycardia
akan terlihat seperti ini:ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia
. Anda memisahkan setiap bagian dari petunjuk dengan tanda hubung (-).Bahkan jika Anda tidak memberikan nilai untuk
SoundsLike
kolom, Anda harus menyertakanSoundsLike
kolom kosong. Jika Anda menyertakan nilai diSoundsLike
kolom, Anda tidak dapat memberikan nilai untukIPA
kolom.Anda dapat menggunakan salah satu karakter yang diizinkan untuk bahasa input. Untuk daftar karakter yang diizinkan, lihatSet karakter untukAmazon Transcribe Medis.
-
DisplayAs
(kolom diperlukan, nilai dapat opsional) - Mendefinisikan bagaimana kata atau frasa terlihat ketika itu output. Misalnya, jika kata atau frasacerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy
, Anda dapat menentukan bentuk tampilan sebagaicerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy
, sehingga tanda hubung tidak ada. Anda juga dapat menentukanDisplayAs
CADASIL
seolah-olah Anda ingin menampilkan akronim alih-alih istilah penuh dalam output.Jika Anda tidak menentukan
DisplayAs
kolom,Amazon Transcribe Medis menggunakanPhrase
kolom dari file input di output.Anda dapat menggunakan karakter UTF-8 apa pun di
DisplayAs
kolom.
Anda dapat menyertakan spasi hanya untuk nilai-nilai dalamIPA
danDisplayAs
kolom.
Untuk membuat file teks dari kosakata khusus Anda, tempatkan setiap kata atau frasa dalam file teks Anda pada baris terpisah. Pisahkan kolom dengan karakter Tab. Sertakan spasi hanya untuk nilai dalamIPA
danDisplayAs
kolom. Simpan file dengan ekstensi dalamAmazon S3 bucket.txt
diWilayah AWS tempat yang sama di mana Anda menggunakanAmazon Transcribe Medis untuk membuat kosakata khusus Anda.
Jika Anda mengedit file teks Anda di Windows, pastikan file Anda dalamLF
format dan tidak dalamCRLF
format. Jika tidak, Anda tidak akan dapat membuat kosakata khusus Anda. Beberapa editor teks memungkinkan Anda untuk mengubah format dengan perintah Find and Replace.
Contoh berikut menunjukkan teks yang dapat Anda gunakan untuk membuat kosakata khusus. Untuk membuat kosakata khusus dari contoh-contoh ini, salin contoh ke editor teks, ganti[TAB]
dengan karakter Tab, dan unggah file teks yang disimpan keAmazon S3.
Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]
Anda dapat memasukkan kolom dalam urutan apa pun. Contoh berikut menunjukkan struktur valid lainnya untuk file input kosakata kustom.
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase
acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome
ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L.
[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia
Untuk kemudahan membaca, tabel berikut menunjukkan contoh sebelumnya dengan lebih jelas dalam format html. Mereka dimaksudkan hanya untuk menggambarkan contoh.
Frasa | IPA | SoundsLike | DisplayAs |
---|---|---|---|
acute-respiratory-distress-syndrome | sindrom gangguan pernapasan akut | ||
A.L.L. | eɪ ɛ l ɛ l | SEMUA | |
atrioventricular-nodal-reentrant-tachycardia | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |
Frasa | SoundsLike | IPA | DisplayAs |
---|---|---|---|
acute-respiratory-distress-syndrome | sindrom gangguan pernapasan akut | ||
atrioventricular-nodal-reentrant-tachycardia | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia | ||
A.L.L. | eɪ ɛ l ɛ l | SEMUA |
DisplayAs | SoundsLike | IPA | Frasa |
---|---|---|---|
sindrom gangguan pernapasan akut | acute-respiratory-distress-syndrome | ||
SEMUA | eɪ ɛ l ɛ l | A.L.L. | |
ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia | atrioventricular-nodal-reentrant-tachycardia |