Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menggunakan model bahasa khusus
Setelah Anda membuat model bahasa kustom Anda, Anda dapat memasukkannya ke dalam permintaan transkripsi Anda; lihat bagian berikut untuk contoh.
Bahasa model yang Anda sertakan dalam permintaan harus sesuai dengan kode bahasa yang Anda tentukan untuk media Anda. Jika bahasa tidak cocok, model bahasa kustom Anda tidak diterapkan ke transkripsi Anda dan tidak ada peringatan atau kesalahan.
Menggunakan model bahasa khusus dalam transkripsi batch
Untuk menggunakan model bahasa khusus dengan transkripsi batch, lihat contoh berikut:
-
Masuk ke Konsol Manajemen AWS
. -
Di panel navigasi, pilih Pekerjaan transkripsi, lalu pilih Buat pekerjaan (kanan atas). Ini membuka halaman Tentukan detail pekerjaan.
-
Di panel Pengaturan Job di bawah Jenis model, pilih kotak Model bahasa kustom.
Anda juga harus memilih bahasa input dari menu dropdown.
-
Di bawah Pemilihan model kustom, pilih model bahasa kustom yang ada dari menu tarik-turun atau Buat yang baru.
Tambahkan Amazon S3 lokasi file input Anda di panel data Input.
-
Pilih Berikutnya untuk opsi konfigurasi tambahan.
Pilih Buat pekerjaan untuk menjalankan pekerjaan transkripsi Anda.
Contoh ini menggunakan start-transcription-jobModelSettings parameter dengan VocabularyName sub-parameter. Untuk informasi selengkapnya, silakan lihat StartTranscriptionJob dan ModelSettings.
aws transcribe start-transcription-job \ --regionus-west-2\ --transcription-job-namemy-first-transcription-job\ --media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac\ --output-bucket-nameamzn-s3-demo-bucket\ --output-keymy-output-files/ \ --language-codeen-US\ --model-settings LanguageModelName=my-first-language-model
Berikut contoh lain menggunakan start-transcription-job
aws transcribe start-transcription-job \ --regionus-west-2\ --cli-input-json file://my-first-model-job.json
File my-first-model-job.json berisi badan permintaan berikut.
{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac" }, "OutputBucketName": "amzn-s3-demo-bucket", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "ModelSettings": { "LanguageModelName": "my-first-language-model" } }
Contoh ini menggunakan AWS SDK untuk Python (Boto3) untuk menyertakan model bahasa kustom menggunakan ModelSettings argumen untuk metode start_transcription_jobStartTranscriptionJob dan ModelSettings.
Untuk contoh tambahan menggunakan AWS SDKs, termasuk contoh khusus fitur, skenario, dan lintas layanan, lihat bagian ini. Contoh kode untuk Amazon Transcribe menggunakan AWS SDKs
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket', OutputKey = 'my-output-files/', LanguageCode = 'en-US', ModelSettings = { 'LanguageModelName': 'my-first-language-model' } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Menggunakan model bahasa khusus dalam transkripsi streaming
Untuk menggunakan model bahasa khusus dengan transkripsi streaming, lihat contoh berikut ini:
-
Masuk ke Konsol Manajemen AWS
. -
Di panel navigasi, pilih Transkripsi waktu nyata. Gulir ke bawah ke Kustomisasi dan perluas bidang ini jika diminimalkan.
-
Beralih pada model bahasa Kustom dan pilih model dari menu tarik-turun.
Sertakan pengaturan lain yang ingin Anda terapkan ke streaming Anda.
-
Anda sekarang siap untuk mentranskripsikan aliran Anda. Pilih Mulai streaming dan mulai berbicara. Untuk mengakhiri dikte Anda, pilih Hentikan streaming.
Contoh ini membuat permintaan HTTP/2 yang menyertakan model bahasa kustom Anda. Untuk informasi lebih lanjut tentang menggunakan streaming HTTP/2 dengan Amazon Transcribe, lihat. Menyiapkan aliran HTTP/2 Untuk detail selengkapnya tentang parameter dan header khusus untuk Amazon Transcribe, lihat StartStreamTranscription.
POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscriptionContent-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256:stringX-Amz-Date:20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=stringx-amzn-transcribe-language-code:en-USx-amzn-transcribe-media-encoding:flacx-amzn-transcribe-sample-rate:16000x-amzn-transcribe-language-model-name:my-first-language-modeltransfer-encoding: chunked
Definisi parameter dapat ditemukan di Referensi API; parameter yang umum untuk semua operasi AWS API tercantum di bagian Parameter Umum.
Contoh ini membuat URL presigned yang menerapkan model bahasa kustom Anda ke WebSocket stream. Jeda baris telah ditambahkan untuk keterbacaan. Untuk informasi selengkapnya tentang penggunaan WebSocket stream dengan Amazon Transcribe, lihatMenyiapkan WebSocket aliran. Untuk detail lebih lanjut tentang parameter, lihat StartStreamTranscription.
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300&X-Amz-Security-Token=security-token&X-Amz-Signature=string&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US&media-encoding=flac&sample-rate=16000&language-model-name=my-first-language-model
Definisi parameter dapat ditemukan di Referensi API; parameter yang umum untuk semua operasi AWS API tercantum di bagian Parameter Umum.