Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menggunakan kosakata khusus
Setelah kosakata kustom Anda dibuat, Anda dapat memasukkannya ke dalam permintaan transkripsi Anda; lihat bagian berikut untuk contoh.
Bahasa kosakata khusus yang Anda sertakan dalam permintaan Anda harus sesuai dengan kode bahasa yang Anda tentukan untuk media Anda. Jika bahasa tidak cocok, kosakata kustom Anda tidak diterapkan pada transkripsi Anda dan tidak ada peringatan atau kesalahan.
Menggunakan kosakata khusus dalam transkripsi batch
Untuk menggunakan kosakata khusus dengan transkripsi batch, lihat contoh berikut ini:
-
Masuk ke AWS Management Console
. -
Di panel navigasi, pilih Pekerjaan transkripsi, lalu pilih Buat pekerjaan (kanan atas). Ini membuka halaman Tentukan detail pekerjaan.
Beri nama pekerjaan Anda dan tentukan media masukan Anda. Secara opsional sertakan bidang lain, lalu pilih Berikutnya.
-
Di bagian bawah halaman Configure job, di panel Customization, aktifkan Kosakata kustom.
-
Pilih kosakata kustom Anda dari menu dropdown.
Pilih Buat pekerjaan untuk menjalankan pekerjaan transkripsi Anda.
Contoh ini menggunakan start-transcription-jobSettings
parameter denganVocabularyName
sub-parameter. Untuk informasi selengkapnya, lihat StartTranscriptionJob
dan Settings
.
aws transcribe start-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
\ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
\ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --output-keymy-output-files
/ \ --language-codeen-US
\ --settings VocabularyName=my-first-vocabulary
Berikut contoh lain menggunakan start-transcription-job
aws transcribe start-transcription-job \ --region
us-west-2
\ --cli-input-json file://my-first-vocabulary-job
.json
File my-first-vocabulary-job.json berisi badan permintaan berikut.
{ "TranscriptionJobName": "
my-first-transcription-job
", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET
", "OutputKey": "my-output-files
/", "LanguageCode": "en-US
", "Settings": { "VocabularyName": "my-first-vocabulary
" } }
Contoh ini menggunakanAWS SDK for Python (Boto3) untuk menyertakan kosakata kustom menggunakanSettings
argumen untuk metode start_transcription_jobStartTranscriptionJob
dan Settings
.
Untuk contoh tambahan yang menggunakanAWS SDK, termasuk contoh spesifik-fitur, skenario, dan lintas-layanan, lihat bagianContoh kode untuk Amazon Transcribe menggunakan SDK AWS ini.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') job_name = "my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET
', OutputKey = 'my-output-files
/', LanguageCode = 'en-US
', Settings = { 'VocabularyName': 'my-first-vocabulary
' } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Menggunakan kosakata khusus dalam transkripsi streaming
Untuk menggunakan kosakata khusus dengan transkripsi streaming, lihat contoh berikut ini:
-
Masuk ke dalam AWS Management Console
. -
Di panel navigasi, pilih Transkripsi waktu. Gulir ke bawah ke Kustomisasi dan perluas bidang ini jika diminimalkan.
-
Aktifkan Kosakata khusus dan pilih kosakata khusus dari menu tarik-turun.
Sertakan setelan lain yang ingin diterapkan ke streaming Anda.
-
Sekarang Anda siap untuk menuliskan aliran Anda. Pilih Mulai streaming dan mulai berbicara. Untuk mengakhiri dikte Anda, pilih Hentikan streaming.
Contoh ini membuat permintaan HTTP/2 yang menyertakan kosakata kustom Anda. Untuk informasi lebih lanjut tentang menggunakan HTTP/2 streaming denganAmazon Transcribe, lihatMenyiapkan aliran HTTP /2. Untuk detail lebih lanjut tentang parameter dan header khusus untukAmazon Transcribe, lihat StartStreamTranscription
.
POST /stream-transcription HTTP/2 host: transcribestreaming.
us-west-2
.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256:string
X-Amz-Date:20220208
T235959
Z Authorization: AWS4-HMAC-SHA256 Credential=access-key
/20220208
/us-west-2
/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code:en-US
x-amzn-transcribe-media-encoding:flac
x-amzn-transcribe-sample-rate:16000
x-amzn-transcribe-vocabulary-name:my-first-vocabulary
transfer-encoding: chunked
Definisi parameter dapat ditemukan di Referensi API; parameter yang umum untuk semua operasiAWS API dicantumkan di bagian Parameter Umum.
Contoh ini membuat URL yang telah ditandatangani sebelumnya yang menerapkan kosakata kustom Anda ke WebSocket stream. Jeda baris telah ditambahkan untuk keterbacaan. Untuk informasi lebih lanjut tentang menggunakan WebSocket stream denganAmazon Transcribe, lihatMenyiapkan WebSocket aliran. Untuk detail lebih lanjut tentang parameter, lihat StartStreamTranscription
.
GET wss://transcribestreaming.
us-west-2
.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE
%2F20220208
%2Fus-west-2
%2Ftranscribe
%2Faws4_request &X-Amz-Date=20220208
T235959
Z &X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US
&media-encoding=flac
&sample-rate=16000
&vocabulary-name=my-first-vocabulary
Definisi parameter dapat ditemukan di Referensi API; parameter yang umum untuk semua operasiAWS API dicantumkan di bagian Parameter Umum.