Mengintegrasikan beban kerja cloud tradisional dengan Amazon Bedrock - AWS Bimbingan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mengintegrasikan beban kerja cloud tradisional dengan Amazon Bedrock

Ruang lingkup kasus penggunaan ini adalah untuk menunjukkan beban kerja cloud tradisional yang terintegrasi dengan Amazon Bedrock untuk memanfaatkan kemampuan AI generatif. Diagram berikut menggambarkan akun Generative AI dalam hubungannya dengan contoh akun aplikasi. 

Mengintegrasikan beban kerja cloud tradisional dengan Amazon Bedrock

Akun Generative AI didedikasikan untuk menyediakan fungsionalitas AI generatif dengan menggunakan Amazon Bedrock. Akun Aplikasi adalah contoh beban kerja sampel. Layanan AWS yang Anda gunakan di akun ini bergantung pada kebutuhan Anda. Interaksi antara akun Generative AI dan akun Aplikasi menggunakan Amazon Bedrock API. 

Akun Aplikasi dipisahkan dari akun Generative AI untuk membantu mengelompokkan beban kerja berdasarkan tujuan bisnis dan kepemilikan. Ini membantu membatasi akses ke data sensitif di lingkungan AI generatif dan mendukung penerapan kontrol keamanan yang berbeda berdasarkan lingkungan. Menjaga beban kerja cloud tradisional di akun terpisah juga membantu membatasi ruang lingkup dampak efek samping

Anda dapat membangun dan menskalakan aplikasi AI generatif perusahaan di sekitar berbagai kasus penggunaan yang didukung oleh Amazon Bedrock. Beberapa kasus penggunaan umum adalah pembuatan teks, bantuan virtual, pencarian teks dan gambar, ringkasan teks, dan pembuatan gambar. Bergantung pada kasus penggunaan Anda, komponen aplikasi berinteraksi dengan satu atau beberapa kemampuan Amazon Bedrock seperti basis pengetahuan dan agen. 

Akun aplikasi

Akun Aplikasi menghosting infrastruktur dan layanan utama untuk menjalankan dan memelihara aplikasi perusahaan. Dalam konteks ini, akun Aplikasi bertindak sebagai beban kerja cloud tradisional, yang berinteraksi dengan layanan terkelola Amazon Bedrock di akun Generative AI. Lihat bagian Akun Aplikasi OU Beban Kerja untuk praktik terbaik keamanan umum untuk mengamankan akun ini. 

Praktik terbaik keamanan aplikasi standar berlaku seperti pada aplikasi lain. Jika Anda berencana untuk menggunakan retrieval augmented generation (RAG), di mana aplikasi meminta informasi yang relevan dari basis pengetahuan seperti database vektor dengan menggunakan prompt teks dari pengguna, aplikasi perlu menyebarkan identitas pengguna ke basis pengetahuan, dan basis pengetahuan memberlakukan kontrol akses berbasis peran atau atribut Anda.

Pola desain lain untuk aplikasi AI generatif adalah menggunakan agen untuk mengatur interaksi antara model dasar (FM), sumber data, basis pengetahuan, dan aplikasi perangkat lunak. Agen memanggil API untuk mengambil tindakan atas nama pengguna yang berinteraksi dengan model. Mekanisme yang paling penting untuk mendapatkan yang benar adalah memastikan bahwa setiap agen menyebarkan identitas pengguna aplikasi ke sistem yang berinteraksi dengannya. Anda juga harus memastikan bahwa setiap sistem (sumber data, aplikasi, dan sebagainya) memahami identitas pengguna, membatasi tanggapannya terhadap tindakan yang diizinkan oleh pengguna untuk dilakukan, dan merespons dengan data yang diizinkan untuk diakses oleh pengguna.

Penting juga untuk membatasi akses langsung ke titik akhir inferensi model yang telah dilatih sebelumnya yang digunakan untuk menghasilkan kesimpulan. Anda ingin membatasi akses ke titik akhir inferensi untuk mengontrol biaya dan memantau aktivitas. Jika titik akhir inferensi Anda di-host di AWS, seperti dengan model dasar Amazon Bedrock, Anda dapat menggunakan IAM untuk mengontrol izin untuk menjalankan tindakan inferensi. 

Jika aplikasi AI Anda tersedia untuk pengguna sebagai aplikasi web, Anda harus melindungi infrastruktur Anda dengan menggunakan kontrol seperti firewall aplikasi web. Ancaman cyber tradisional seperti suntikan SQL dan banjir permintaan mungkin terjadi terhadap aplikasi Anda. Karena pemanggilan aplikasi Anda menyebabkan pemanggilan API inferensi model, dan panggilan API inferensi model biasanya dikenakan biaya, penting untuk mengurangi banjir untuk meminimalkan biaya tak terduga dari penyedia FM Anda. Firewall aplikasi web tidak melindungi terhadap ancaman injeksi yang cepat, karena ancaman ini dalam bentuk teks bahasa alami. Firewall mencocokkan kode (misalnya, HTML, SQL, atau ekspresi reguler) di tempat-tempat yang tidak terduga (teks, dokumen, dan sebagainya). Untuk membantu melindungi dari serangan injeksi yang cepat dan memastikan keamanan model, gunakan pagar pembatas

Pencatatan dan pemantauan inferensi dalam model AI generatif sangat penting untuk menjaga keamanan dan mencegah penyalahgunaan. Ini memungkinkan identifikasi pelaku ancaman potensial, aktivitas jahat, atau akses tidak sah, dan membantu memungkinkan intervensi tepat waktu dan mitigasi risiko yang terkait dengan penyebaran model yang kuat ini.

Akun AI generatif

Bergantung pada kasus penggunaan, akun Generative AI menampung semua aktivitas AI generatif. Ini termasuk, tetapi tidak terbatas pada, pemanggilan model, RAG, agen dan alat, dan penyesuaian model. Lihat bagian sebelumnya yang membahas kasus penggunaan tertentu untuk melihat fitur dan implementasi mana yang diperlukan untuk beban kerja Anda. 

Arsitektur yang disajikan dalam panduan ini menawarkan kerangka kerja komprehensif bagi organisasi yang menggunakan layanan AWS untuk memanfaatkan kemampuan AI generatif secara aman dan efisien. Arsitektur ini menggabungkan fungsionalitas Amazon Bedrock yang dikelola sepenuhnya dengan praktik terbaik keamanan untuk memberikan dasar yang kuat untuk mengintegrasikan AI generatif ke dalam beban kerja cloud tradisional dan proses organisasi. Kasus penggunaan khusus yang dicakup, termasuk menyediakan AI FM generatif, RAG, agen, dan kustomisasi model, menangani berbagai aplikasi dan skenario potensial. Panduan ini melengkapi organisasi dengan pemahaman yang diperlukan tentang layanan AWS Bedrock dan kontrol keamanan yang melekat dan dapat dikonfigurasi, memungkinkan mereka untuk membuat keputusan berdasarkan informasi yang disesuaikan dengan infrastruktur, aplikasi, dan persyaratan keamanan unik mereka.