Membuat kosakata khusus menggunakan daftar - Amazon Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Membuat kosakata khusus menggunakan daftar

Anda dapat membuat kosakata khusus dari daftar menggunakanAWS Management Console,AWS CLI, atau AWS SDK.

  • AWS Management Console: Anda harus membuat dan mengunggah file teks yang berisi kosakata khusus Anda. Anda dapat menggunakan entri yang dipisahkan baris atau dipisahkan koma. Perhatikan bahwa daftar Anda harus disimpan sebagai file teks (*.txt) dalam format. LF Jika Anda menggunakan format lain, sepertiCRLF, kosakata kustom Anda tidak diterima oleh. Amazon Transcribe

  • AWS CLIdan AWSSDK: Anda harus menyertakan kosakata kustom Anda sebagai entri yang dipisahkan koma dalam panggilan API Anda menggunakan bendera. Phrases

Jika entri berisi beberapa kata, Anda harus hyphenate setiap kata. Misalnya, Anda memasukkan 'Los Angeles' as Los-Angeles dan 'Andorra la Vella' sebagai. Andorra-la-Vella

Berikut adalah contoh dari dua format daftar yang valid. Lihat untuk Membuat daftar kosakata kustom contoh metode-spesifik.

  • Entri yang dipisahkan koma:

    Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
  • Entri yang dipisahkan baris:

    Los-Angeles CLI Eva-Maria ABCs Andorra-la-Vella
penting

Anda hanya dapat menggunakan karakter yang didukung untuk bahasa Anda. Lihat set karakter bahasa Anda untuk detailnya.

Daftar kosakata kustom tidak didukung dengan operasi. CreateMedicalVocabulary Jika membuat kosakata medis khusus, Anda harus menggunakan format tabel; lihat Membuat kosakata khusus menggunakan tabel untuk instruksi.

Membuat daftar kosakata kustom

Untuk memproses daftar kosakata kustom untuk digunakan denganAmazon Transcribe, lihat contoh berikut:

Contoh ini menggunakan perintah create-kosa kata dengan file kosakata kustom daftar-diformat. Untuk informasi selengkapnya, lihat CreateVocabulary.

aws transcribe create-vocabulary \ --vocabulary-name my-first-vocabulary \ --language-code en-US \ --phrases {CLI,Eva-Maria,ABCs}

Berikut contoh lain menggunakan perintah create-kosa kata, dan badan permintaan yang membuat kosakata kustom Anda.

aws transcribe create-vocabulary \ --cli-input-json file://filepath/my-first-vocab-list.json

File my-first-vocab-list.json berisi badan permintaan berikut.

{ "VocabularyName": "my-first-vocabulary", "LanguageCode": "en-US", "Phrases": [ "CLI","Eva-Maria","ABCs" ] }

Setelah VocabularyState berubah dari PENDING keREADY, kosakata kustom Anda siap digunakan dengan transkripsi. Untuk melihat status kosakata kustom saat ini, jalankan:

aws transcribe get-vocabulary \ --vocabulary-name my-first-vocabulary

Contoh ini menggunakan AWS SDK for Python (Boto3) untuk membuat kosakata kustom dari daftar menggunakan metode create_vocabulary. Untuk informasi selengkapnya, lihat CreateVocabulary.

Untuk contoh tambahan yang menggunakan AWS SDK, termasuk contoh spesifik-fitur, skenario, dan lintas-layanan, lihat bagian ini. Contoh kode untuk Amazon Transcribe menggunakan SDK AWS

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary" response = transcribe.create_vocabulary( LanguageCode = 'en-US', VocabularyName = vocab_name, Phrases = [ 'CLI','Eva-Maria','ABCs' ] ) while True: status = transcribe.get_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
catatan

Jika Anda membuat Amazon S3 bucket baru untuk file kosakata kustom Anda, pastikan IAM peran yang membuat CreateVocabularypermintaan memiliki izin untuk mengakses bucket ini. Jika peran tidak memiliki izin yang benar, permintaan Anda gagal. Anda dapat secara opsional menentukan IAM peran dalam permintaan Anda dengan menyertakan DataAccessRoleArn parameter. Untuk informasi selengkapnya tentang IAM peran dan kebijakan diAmazon Transcribe, lihatContoh kebijakan berbasis identitas Amazon Transcribe.