Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Membuat kosakata khusus menggunakan daftar
Anda dapat membuat kosakata khusus dari daftar menggunakanAWS Management Console,AWS CLI, atau AWS SDK.
-
AWS Management Console: Anda harus membuat dan mengunggah file teks yang berisi kosakata khusus Anda. Anda dapat menggunakan entri yang dipisahkan baris atau dipisahkan koma. Perhatikan bahwa daftar Anda harus disimpan sebagai file teks (*.txt) dalam format.
LF
Jika Anda menggunakan format lain, sepertiCRLF
, kosakata kustom Anda tidak diterima oleh. Amazon Transcribe -
AWS CLIdan AWSSDK: Anda harus menyertakan kosakata kustom Anda sebagai entri yang dipisahkan koma dalam panggilan API Anda menggunakan bendera.
Phrases
Jika entri berisi beberapa kata, Anda harus hyphenate setiap kata. Misalnya, Anda memasukkan 'Los Angeles' as Los-Angeles
dan 'Andorra la Vella' sebagai. Andorra-la-Vella
Berikut adalah contoh dari dua format daftar yang valid. Lihat untuk Membuat daftar kosakata kustom contoh metode-spesifik.
-
Entri yang dipisahkan koma:
Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
-
Entri yang dipisahkan baris:
Los-Angeles CLI Eva-Maria ABCs Andorra-la-Vella
penting
Anda hanya dapat menggunakan karakter yang didukung untuk bahasa Anda. Lihat set karakter bahasa Anda untuk detailnya.
Daftar kosakata kustom tidak didukung dengan operasi. CreateMedicalVocabulary
Jika membuat kosakata medis khusus, Anda harus menggunakan format tabel; lihat Membuat kosakata khusus menggunakan tabel untuk instruksi.
Membuat daftar kosakata kustom
Untuk memproses daftar kosakata kustom untuk digunakan denganAmazon Transcribe, lihat contoh berikut:
Contoh ini menggunakan perintah create-kosa kata dengan file kosakata kustom daftar-diformat. Untuk informasi selengkapnya, lihat CreateVocabulary
.
aws transcribe create-vocabulary \ --vocabulary-name
my-first-vocabulary
\ --language-codeen-US
\ --phrases {CLI,Eva-Maria,ABCs
}
Berikut contoh lain menggunakan perintah create-kosa kata, dan badan permintaan yang membuat kosakata kustom Anda.
aws transcribe create-vocabulary \ --cli-input-json file://
filepath
/my-first-vocab-list
.json
File my-first-vocab-list.json berisi badan permintaan berikut.
{ "VocabularyName": "
my-first-vocabulary
", "LanguageCode": "en-US
", "Phrases": [ "CLI
","Eva-Maria
","ABCs
" ] }
Setelah VocabularyState
berubah dari PENDING
keREADY
, kosakata kustom Anda siap digunakan dengan transkripsi. Untuk melihat status kosakata kustom saat ini, jalankan:
aws transcribe get-vocabulary \ --vocabulary-name
my-first-vocabulary
Contoh ini menggunakan AWS SDK for Python (Boto3) untuk membuat kosakata kustom dari daftar menggunakan metode create_vocabularyCreateVocabulary
.
Untuk contoh tambahan yang menggunakan AWS SDK, termasuk contoh spesifik-fitur, skenario, dan lintas-layanan, lihat bagian ini. Contoh kode untuk Amazon Transcribe menggunakan SDK AWS
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') vocab_name = "my-first-vocabulary
" response = transcribe.create_vocabulary( LanguageCode = 'en-US
', VocabularyName = vocab_name, Phrases = [ 'CLI
','Eva-Maria
','ABCs
' ] ) while True: status = transcribe.get_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
catatan
Jika Anda membuat Amazon S3 bucket baru untuk file kosakata kustom Anda, pastikan IAM peran yang membuat CreateVocabulary
permintaan memiliki izin untuk mengakses bucket ini. Jika peran tidak memiliki izin yang benar, permintaan Anda gagal. Anda dapat secara opsional menentukan IAM peran dalam permintaan Anda dengan menyertakan DataAccessRoleArn
parameter. Untuk informasi selengkapnya tentang IAM peran dan kebijakan diAmazon Transcribe, lihatContoh kebijakan berbasis identitas Amazon Transcribe.