Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mentranskripsikan audio multi-saluran
Jika audio Anda memiliki dua saluran, Anda dapat menggunakan identifikasi saluran untuk mentranskripsikan ucapan dari setiap saluran secara terpisah. Amazon TranscribeSaat ini tidak mendukung audio dengan lebih dari dua saluran.
Dalam transkrip Anda, saluran diberi labelch_0
danch_1
.
Selain bagian transkrip standar (transcripts
danitems
), permintaan dengan identifikasi saluran diaktifkan termasukchannel_labels
bagian. Bagian ini berisi setiap ucapan atau tanda baca, dikelompokkan berdasarkan saluran, serta label saluran terkait, stempel waktu, dan skor kepercayaan diri.
"channel_labels": { "channels": [ { "channel_label": "ch_0", "items": [ { "channel_label": "ch_0", "start_time": "4.86", "end_time": "5.01", "alternatives": [ { "confidence": "1.0", "content": "I've" } ], "type": "pronunciation" },
...
"channel_label": "ch_1", "items": [ { "channel_label": "ch_1", "start_time": "8.5", "end_time": "8.89", "alternatives": [ { "confidence": "1.0", "content": "Sorry" } ], "type": "pronunciation" },...
"number_of_channels": 2 },
Perhatikan bahwa jika seseorang di satu saluran berbicara pada saat yang sama dengan orang di saluran terpisah, stempel waktu untuk setiap saluran tumpang tindih saat individu berbicara satu sama lain.
Untuk melihat contoh transkrip lengkap dengan identifikasi saluran, lihatContoh keluaran identifikasi saluran (batch).
Menggunakan identifikasi saluran dalam transkripsi batch
Untuk mengidentifikasi saluran dalam transkripsi batch, Anda dapat menggunakan AWS Management Console, AWS CLI, atau AWSSDK; lihat contoh berikut ini:
-
Masuk ke AWS Management Console
. -
Di panel navigasi, pilih Pekerjaan transkripsi, lalu pilih Buat pekerjaan (kanan atas). Ini membuka halaman Tentukan detail pekerjaan.
-
Isi kolom apa pun yang ingin Anda sertakan di halaman Tentukan detail pekerjaan, lalu pilih Berikutnya. Ini akan membawa Anda ke halaman Konfigurasi pekerjaan - opsional.
Di panel Pengaturan audio, pilih Identifikasi saluran (di bawah judul 'Jenis identifikasi audio').
-
Pilih Buat pekerjaan untuk menjalankan pekerjaan transkripsi Anda.
Contoh ini menggunakan start-transcription-jobStartTranscriptionJob
.
aws transcribe start-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
\ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
\ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --output-keymy-output-files
/ \ --language-codeen-US
\ --settings ChannelIdentification=true
Berikut contoh lain menggunakan start-transcription-job
aws transcribe start-transcription-job \ --region
us-west-2
\ --cli-input-json file://my-first-transcription-job
.json
File my-first-transcription-job.json berisi badan permintaan berikut.
{ "TranscriptionJobName": "
my-first-transcription-job
", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET
", "OutputKey": "my-output-files
/", "LanguageCode": "en-US
", "Settings": { "ChannelIdentification": true } }
Contoh ini menggunakanAWS SDK for Python (Boto3) untuk mengidentifikasi saluran menggunakan metode start_transcription_job
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') job_name = "my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET
', OutputKey = 'my-output-files
/', LanguageCode = 'en-US
', Settings = { 'ChannelIdentification':True } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Menggunakan identifikasi saluran dalam transkripsi streaming
Untuk mengidentifikasi saluran dalam transkripsi streaming, Anda dapat menggunakan HTTP/2 atau WebSockets; lihat contoh berikut:
Contoh ini membuat permintaan HTTP/2 yang memisahkan saluran dalam output transkripsi Anda. Untuk informasi lebih lanjut tentang menggunakan HTTP/2 streaming denganAmazon Transcribe, lihatMenyiapkan aliran HTTP /2. Untuk detail lebih lanjut tentang parameter dan header khusus untukAmazon Transcribe, lihat StartStreamTranscription.
POST /stream-transcription HTTP/2 host: transcribestreaming.
us-west-2
.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256:string
X-Amz-Date:20220208
T235959
Z Authorization: AWS4-HMAC-SHA256 Credential=access-key
/20220208
/us-west-2
/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code:en-US
x-amzn-transcribe-media-encoding:flac
x-amzn-transcribe-sample-rate:16000
x-amzn-channel-identification: TRUE transfer-encoding: chunked
Definisi parameter dapat ditemukan di Referensi API; parameter yang umum untuk semua operasiAWS API dicantumkan di bagian Parameter Umum.
Contoh ini membuat URL yang telah ditandatangani sebelumnya yang memisahkan saluran dalam output transkripsi Anda. Jeda baris telah ditambahkan untuk keterbacaan. Untuk informasi lebih lanjut tentang menggunakan WebSocket stream denganAmazon Transcribe, lihatMenyiapkan WebSocket aliran. Untuk detail lebih lanjut tentang parameter, lihat StartStreamTranscription
.
GET wss://transcribestreaming.
us-west-2
.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE
%2F20220208
%2Fus-west-2
%2Ftranscribe
%2Faws4_request &X-Amz-Date=20220208
T235959
Z &X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &specialty=PRIMARYCARE
&type=DICTATION
&media-encoding=flac
&sample-rate=16000
&channel-identification=TRUE
Definisi parameter dapat ditemukan di Referensi API; parameter yang umum untuk semua operasiAWS API dicantumkan di bagian Parameter Umum.