Input dan output data - Amazon Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Input dan output data

Amazon Transcribemengambil data audio, sebagai file media dalamAmazon S3 ember atau aliran media, dan mengubahnya menjadi data teks.

Jika Anda menyalin file media yang disimpan dalamAmazon S3 bucket, Anda melakukan transkripsi batch. Jika Anda menyalin aliran media, Anda melakukan transkripsi streaming. Kedua proses ini memiliki aturan dan persyaratan yang berbeda.

Dengan transkripsi batch, Anda dapat menggunakanMembatasi jika Anda tidak perlu memproses semua pekerjaan transkripsi Anda secara bersamaan. Hal ini memungkinkanAmazon Transcribe untuk melacak pekerjaan transkripsi Anda dan memprosesnya saat slot tersedia.

catatan

Amazon Transcribedapat menyimpan sementara konten Anda untuk terus meningkatkan kualitas model analisisnya. Lihat Amazon TranscribeFAQ untuk mempelajari lebih lanjut. Untuk meminta penghapusan konten yang mungkin telah disimpan olehAmazon Transcribe, buka kasus dengan AWS Support.

Format media

Jenis media yang didukung berbeda antara transkripsi batch dan transkripsi streaming, meskipun format lossless direkomendasikan untuk keduanya. Lihat tabel berikut untuk detailnya:

Batch

Streaming

Format yang didukung

  • AMR

  • FLAC

  • M4A

  • MP3

  • MP4

  • Ogg

  • WebM

  • WAV

  • FLAC

  • Ogg

  • Encoding PCM

Format yang disarankan

  • FLAC

  • WAV dengan pengkodean PCM 16-bit

  • FLAC

  • Audio little-endian 16-bit yang ditandatangani PCM (perhatikan bahwa ini tidak termasuk WAV)

Untuk hasil terbaik, gunakan format lossless, seperti FLAC atau WAV dengan pengkodean PCM 16-bit.

catatan

Transkripsi streaming tidak didukung dengan semua bahasa. Lihat kolom 'Input data' di tabel bahasa yang didukung untuk detailnya.

Saluran audio

Amazon Transcribemendukung media saluran tunggal dan saluran ganda. Parameter ini saat ini tidak didukung.

Jika audio Anda berisi beberapa speaker pada satu saluran dan Anda ingin partisi dan label setiap speaker dalam output transkripsi Anda, Anda dapat menggunakan partisi Speaker (diarization).

Jika audio berisi ucapan di dua saluran terpisah, Anda dapat menggunakan identifikasi Saluran untuk mentranskripsikan setiap saluran secara terpisah dalam transkrip Anda.

Kedua opsi ini menghasilkan satu file transkrip.

catatan

Jika Anda tidak mengaktifkan partisi Speaker atau identifikasi Saluran, teks transkrip Anda disediakan sebagai satu bagian kontinu.

Tingkat sampel

Dengan pekerjaan transkripsi batch, Anda dapat memilih untuk memberikan laju sampel, meskipun parameter ini opsional. Jika Anda memasukkannya ke dalam permintaan, pastikan nilai yang Anda berikan sesuai dengan laju sampel aktual dalam audio Anda. Jika Anda memberikan laju sampel yang tidak cocok dengan audio Anda, pekerjaan Anda mungkin gagal.

Dengan transkripsi streaming, Anda harus menyertakan laju sampel dalam permintaan Anda. Seperti halnya pekerjaan transkripsi batch, pastikan nilai yang Anda berikan sesuai dengan laju sampel aktual dalam audio Anda.

Kecepatan sampel untuk audio dengan kesetiaan rendah, seperti rekaman telepon, biasanya menggunakan 8.000 Hz. Untuk audio kesetiaan tinggi,Amazon Transcribe mendukung nilai antara 16.000 Hz dan 48.000 Hz.

Output

Output transkripsi dalam format JSON. Bagian pertama dari transkrip Anda berisi transkrip itu sendiri dalam bentuk paragraf, diikuti dengan data tambahan untuk setiap kata dan tanda baca. Data yang diberikan tergantung pada fitur yang Anda sertakan dalam permintaan Anda. Minimal, transkrip Anda berisi waktu mulai, waktu akhir, dan skor kepercayaan diri untuk setiap kata. Bagian berikut menunjukkan contoh keluaran dari permintaan transkripsi dasar yang tidak menyertakan opsi atau fitur tambahan apa pun.

Semua transkrip batch disimpan dalamAmazon S3 ember. Anda dapat memilih untuk menyimpan transkrip diAmazon S3 bucket Anda sendiri, atauAmazon Transcribe menggunakan bucket default yang aman. Untuk mempelajari lebih lanjut tentang membuat dan menggunakanAmazon S3 bucket, lihat Bekerja dengan bucket.

Jika Anda ingin transkrip disimpan dalamAmazon S3 bucket yang Anda miliki, tentukan URI bucket dalam permintaan transkripsi Anda. Pastikan Anda memberikan izinAmazon Transcribe menulis untuk bucket ini sebelum memulai pekerjaan transkripsi batch Anda. Jika Anda menentukan bucket Anda sendiri, transkrip Anda tetap berada di bucket itu sampai Anda menghapusnya.

Jika Anda tidak menentukanAmazon S3 bucket,Amazon Transcribe gunakan bucket yang dikelola layanan yang aman dan memberi Anda URI sementara yang dapat Anda gunakan untuk mengunduh transkrip. Perhatikan bahwa URI sementara berlaku selama 15 menit. Jika Anda mendapatkanAccessDenied kesalahan saat menggunakan URI yang disediakan, buatGetTranscriptionJob permintaan untuk mendapatkan URI sementara baru untuk transkrip Anda.

Jika Anda memilih bucket default, transkrip Anda akan dihapus saat pekerjaan kedaluwarsa (90 hari). Jika Anda ingin menyimpan transkrip Anda melewati tanggal kedaluwarsa ini, Anda harus mengunduhnya.

Transkrip streaming dikembalikan melalui metode yang sama yang Anda gunakan untuk streaming Anda.

Tip

Jika Anda ingin mengubah output JSON Anda menjadi turn-by-turn transkrip dalam format Word, lihat GitHub contoh ini (untuk Python3). Skrip ini bekerja dengan transkrip analitik pasca-panggilan dan transkrip batch standar dengan diarisasi diaktifkan.

Contoh keluaran

Transkrip memberikan transkripsi lengkap dalam bentuk paragraf, diikuti dengan word-for-word rincian, yang menyediakan data untuk setiap kata dan tanda baca. Ini termasuk waktu mulai, waktu akhir, skor kepercayaan diri, dan tipe (pronunciationataupunctuation).

Contoh berikut adalah dari pekerjaan transkripsi batch sederhana yang tidak menyertakan fitur tambahan. Dengan setiap fitur tambahan yang Anda terapkan pada permintaan transkripsi, Anda mendapatkan data tambahan di file keluaran transkrip Anda.

Transkrip batch dasar berisi dua bagian utama:

  1. transcripts: Berisi seluruh transkrip dalam satu blok teks.

  2. items: Berisi informasi tentang setiap kata dan tanda baca daritranscripts bagian.

Setiap fitur tambahan yang Anda sertakan dalam permintaan transkripsi Anda menghasilkan informasi tambahan dalam transkrip Anda.

{ "jobName": "my-first-transcription-job", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "Welcome to Amazon Transcribe." } ], "items": [ { "start_time": "0.64", "end_time": "1.09", "alternatives": [ { "confidence": "1.0", "content": "Welcome" } ], "type": "pronunciation" }, { "start_time": "1.09", "end_time": "1.21", "alternatives": [ { "confidence": "1.0", "content": "to" } ], "type": "pronunciation" }, { "start_time": "1.21", "end_time": "1.74", "alternatives": [ { "confidence": "1.0", "content": "Amazon" } ], "type": "pronunciation" }, { "start_time": "1.74", "end_time": "2.56", "alternatives": [ { "confidence": "1.0", "content": "Transcribe" } ], "type": "pronunciation" }, { "alternatives": [ { "confidence": "0.0", "content": "." } ], "type": "punctuation" } ] }, "status": "COMPLETED" }