Audio - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Audio

Fitur Amazon Bedrock Data Automation (BDA) menawarkan serangkaian output standar untuk memproses dan menghasilkan wawasan untuk file audio. Berikut adalah tampilan rinci pada setiap jenis operasi:

Ringkasan Audio Lengkap

Ringkasan audio lengkap menghasilkan ringkasan keseluruhan dari seluruh file audio. Ini menyaring tema utama, peristiwa, dan informasi yang disajikan di seluruh audio menjadi ringkasan singkat.

Transkrip Audio Lengkap

Fitur transkrip audio lengkap menyediakan representasi teks lengkap dari semua konten lisan dalam audio. Ini menggunakan teknologi pengenalan suara canggih untuk secara akurat mentranskripsikan dialog, narasi, dan elemen audio lainnya. Transkripsi mencakup stamping waktu, sehingga mudah dinavigasi dan mencari melalui konten audio berdasarkan kata-kata yang diucapkan.

Ringkasan Topik

Ringkasan topik audio memisahkan file audio menjadi beberapa bagian yang disebut topik, dan meringkasnya untuk memberikan informasi penting. Topik-topik ini diberikan stempel waktu untuk membantu menempatkannya dalam file audio secara keseluruhan. Fitur ini tidak diaktifkan secara default.

Moderasi Konten

Moderasi konten menggunakan isyarat berbasis audio dan teks untuk mengidentifikasi dan mengklasifikasikan konten beracun berbasis suara ke dalam tujuh kategori berbeda:

  • Kata-kata kotor: Pidato yang berisi kata-kata, frasa, atau akronim yang tidak sopan, vulgar, atau menyinggung.

  • Ucapan kebencian: Pidato yang mengkritik, menghina, mencela, atau merendahkan seseorang atau kelompok berdasarkan identitas (seperti ras, etnis, jenis kelamin, agama, orientasi seksual, kemampuan, dan asal kebangsaan).

  • Seksual: Pidato yang menunjukkan minat seksual, aktivitas, atau gairah menggunakan referensi langsung atau tidak langsung ke bagian tubuh, sifat fisik, atau jenis kelamin.

  • Penghinaan: Pidato yang mencakup bahasa yang merendahkan, mempermalukan, mengejek, menghina, atau meremehkan. Jenis bahasa ini juga diberi label sebagai bullying

  • Kekerasan atau ancaman: Pidato yang mencakup ancaman yang berusaha menimbulkan rasa sakit, cedera, atau permusuhan terhadap seseorang atau kelompok.

  • Grafis: Pidato yang menggunakan citra visual deskriptif dan jelas yang tidak menyenangkan. Jenis bahasa ini sering sengaja bertele-tele untuk memperkuat ketidaknyamanan penerima.

  • Pelecehan atau pelecehan: Pidato dimaksudkan untuk memengaruhi kesejahteraan psikologis penerima, termasuk istilah yang merendahkan dan mengobjektifikasi. Jenis bahasa ini juga diberi label sebagai pelecehan.

Output Standar Audio

Bagian ini berfokus pada objek respons berbeda yang Anda terima dari menjalankan operasi API InvokeDataAutomation pada file audio. Di bawah ini kita akan memecah setiap bagian dari objek respons dan kemudian melihat respons penuh dan terisi untuk dokumen contoh. Bagian pertama yang akan kami terima adalahmetadata.

{ "metadata": { "asset_id": "0", "semantic_modality": "AUDIO", "s3_bucket": "bedrock-data-automation-gamma-assets-us-east-1", "s3_key": "demo-assets/Audio/AWS_TCA-Call-Recording-2.wav", "sample_rate": 8000, "bitrate": 256000, "number_of_channels": 2, "codec": "pcm_s16le", "duration_millis": 237560, "format": "wav" },

Bagian ini memecah informasi tentang file seperti lokasi s3, bitrate, saluran audio, dan formatnya. Selanjutnya kita lihataudio_items.

"audio_items": [ { "item_index": 0, "audio_segment_index": 0, "content": "Auto", "start_timestamp_millis": 9, "end_timestamp_millis": 119 },

Bagian item mencakup rincian file audio berdasarkan suara demi suara. Setiap item biasanya tentang panjang kata. Item_index menunjukkan tempat item dalam indisi audio_items, dan audio_segment_index menunjukkan di mana ia berada dalam indeks segmen yang akan kita bahas selanjutnya.

"audio_segments": [ { "start_timestamp_millis": 0, "end_timestamp_millis": 1970, "segment_index": 0, "type": "TRANSCRIPT", "text": "Auto sales, Cherry speaking. How can I help you?", "audio_item_indices": [ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 ] },

Di sini kita mendapatkan rincian file berdasarkan rentang waktu yang lebih lama, dengan setiap segmen sama dengan kira-kira satu kalimat. Ini memberi tahu kita item audio mana yang termasuk dalam segmen dan teks segmen itu sendiri. Selanjutnya mari kita lihat moderasi konten.

"content_moderation": [ { "id": "93068e72-290d-4aad-8717-a2cd0e02b0d0", "type": "AUDIO_MODERATION", "confidence": 0.0476, "start_timestamp_millis": 0, "end_timestamp_millis": 1970, "moderation_categories": [ { "category": "profanity", "confidence": 0.1582 },

Bagian moderasi konten melewati setiap segmen individu dan menganalisisnya untuk salah satu dari tujuh kategori moderasi, memberikan skor kepercayaan untuk setiap bagian. Bagian selanjutnya adalah topik.

"topics": [ { "topic_index": 0, "start_timestamp_millis": 0, "end_timestamp_millis": 36790, "summary": "As follows:\n\nSuzanne, a customer, recently had her Hyundai serviced at the auto sales shop where Carrie works. Suzanne had a 3 p.m. appointment and got her car serviced, which included an oil change and filter changes. However, when Suzanne left the shop, her oil light was still on, which she found concerning. Carrie acknowledged that this sometimes happens, even after a service visit, and assured Suzanne that she would look into the issue further.", "transcript": { "representation": { "text": "Auto sales, Cherry speaking. How can I help you? Yeah, hi Carrie, um, my name is Suzanne. I literally just left your shop. Um, I just went in and got my Hyundai service. Um, it just was, it just needed like filter error changes oil change and all that kind of stuff, um, but. When I left and my oil light is still on and I don't know why. Got it. You just got it serviced here, but when you drove off the light was still on. Is that what happened? Yeah, yeah, yeah, like I literally like I had a 3 p.m. appointment and I just got it, you know, believe it or not, this, this happens." } }, "audio_segment_indices": [ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ] },

Bagian topik adalah tingkat granularitas berikutnya dari segmen. Ini adalah pengelompokan segmen yang dipecah secara kasar berdasarkan konsep. Setiap topik dilengkapi dengan ringkasan topik yang dihasilkan, dan tes yang tepat dari topik tersebut. Bagian terakhir dari tanggapan kami adalah statistik.

"statistics": { "word_count": 749, "topic_count": 4 }

Bagian ini merangkum informasi tentang file audio. Ini termasuk jumlah kata dan topik total.