Buat basis pengetahuan - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Buat basis pengetahuan

catatan

Anda tidak dapat membuat basis pengetahuan dengan pengguna root. Masuk dengan pengguna IAM sebelum memulai langkah-langkah ini.

Setelah menyiapkan sumber data di Amazon S3 dan penyimpanan vektor pilihan Anda, Anda dapat membuat basis pengetahuan. Pilih tab yang sesuai dengan metode pilihan Anda dan ikuti langkah-langkahnya.

Console
Untuk membuat basis pengetahuan
  1. Masuk ke AWS Management Console, dan buka konsol Amazon Bedrock di https://console.aws.amazon.com/bedrock/.

  2. Dari panel navigasi kiri, pilih Basis pengetahuan.

  3. Di bagian Basis pengetahuan, pilih Buat basis pengetahuan.

  4. Pada halaman Berikan detail basis pengetahuan, siapkan konfigurasi berikut:

    1. (Opsional) Di bagian Detail basis pengetahuan, ubah nama default dan berikan deskripsi untuk basis pengetahuan Anda.

    2. Di bagian izin IAM, pilih peran AWS Identity and Access Management (IAM) yang memberikan izin Amazon Bedrock untuk mengakses layanan lain. AWS Anda dapat membiarkan Amazon Bedrock membuat peran layanan atau memilih peran khusus yang telah Anda buat.

    3. (Opsional) Tambahkan tag ke basis pengetahuan Anda. Untuk informasi selengkapnya, lihat Memberi tanda pada sumber daya.

    4. Pilih Selanjutnya.

  5. Pada halaman Siapkan sumber data, berikan informasi untuk sumber data yang akan digunakan untuk basis pengetahuan:

    1. (Opsional) Ubah nama sumber Data default.

    2. Pilih Akun saat ini atau Akun lain untuk lokasi sumber data

    3. Berikan URI S3 dari objek yang berisi file untuk sumber data yang Anda siapkan. Jika memilih Akun lain, Anda mungkin perlu memperbarui kebijakan bucket Amazon S3 akun lain, kebijakan kunci AWS KMS, dan peran Basis Pengetahuan akun saat ini.

      catatan

      Pilih bucket Amazon S3 di wilayah yang sama dengan basis pengetahuan yang Anda buat. Jika tidak, sumber data Anda akan gagal disinkronkan.

    4. Jika Anda mengenkripsi data Amazon S3 dengan kunci yang dikelola pelanggan, pilih Tambahkan kunci yang dikelola pelanggan untuk data Amazon S3 dan pilih AWS KMS kunci KMS untuk mengizinkan Amazon Bedrock mendekripsi data tersebut. Untuk informasi selengkapnya, lihat Enkripsi informasi yang diteruskan ke Amazon OpenSearch Service.

    5. (Opsional) Untuk mengkonfigurasi pengaturan lanjutan berikut, perluas Pengaturan lanjutan - bagian opsional.

      1. Saat mengonversi data Anda menjadi embeddings, Amazon Bedrock mengenkripsi data Anda dengan kunci AWS yang memiliki dan mengelola, secara default. Untuk menggunakan kunci KMS Anda sendiri, perluas Pengaturan lanjutan, pilih Sesuaikan pengaturan enkripsi (lanjutan), dan pilih kunci. Untuk informasi selengkapnya, lihat Enkripsi penyimpanan data sementara selama konsumsi data.

      2. Pilih dari opsi berikut untuk strategi Chunking untuk sumber data Anda:

        • Pembagian default — Secara default, Amazon Bedrock secara otomatis membagi data sumber Anda menjadi beberapa bagian, sehingga setiap potongan berisi, paling banyak, 300 token. Jika dokumen berisi kurang dari 300 token, maka itu tidak dibagi lebih jauh.

        • Potongan ukuran tetap — Amazon Bedrock membagi data sumber Anda menjadi potongan-potongan ukuran perkiraan yang Anda tetapkan. Konfigurasikan opsi berikut.

          • Token maksimum — Amazon Bedrock membuat potongan yang tidak melebihi jumlah token yang Anda pilih.

          • Persentase tumpang tindih antar potongan — Setiap potongan tumpang tindih dengan potongan berturut-turut dengan persentase yang Anda pilih.

        • Tanpa potongan - Amazon Bedrock memperlakukan setiap file sebagai satu bagian. Jika Anda memilih opsi ini, Anda mungkin ingin pra-proses dokumen Anda dengan membaginya menjadi file terpisah.

        catatan

        Anda tidak dapat mengubah strategi chunking setelah Anda membuat sumber data.

      3. Pilih dari opsi berikut untuk kebijakan penghapusan data untuk sumber data Anda:

        • Hapus: Menghapus semua data dasar milik sumber data dari penyimpanan vektor setelah penghapusan basis pengetahuan atau sumber daya sumber data. Perhatikan bahwa penyimpanan vektor itu sendiri tidak dihapus, hanya data yang mendasarinya. Bendera ini diabaikan jika AWS akun dihapus.

        • Mempertahankan: Mempertahankan semua data yang mendasari dalam penyimpanan vektor Anda setelah penghapusan basis pengetahuan atau sumber daya sumber data.

    6. Pilih Selanjutnya.

  6. Di bagian model Embeddings, pilih model embeddings yang didukung untuk mengubah data Anda menjadi embeddings vektor untuk basis pengetahuan.

  7. Di bagian database Vector, pilih salah satu opsi berikut untuk menyimpan embeddings vektor untuk basis pengetahuan Anda:

    • Cepat membuat toko vektor baru - Amazon Bedrock membuat koleksi pencarian vektor Amazon OpenSearch Tanpa Server untuk Anda. Dengan opsi ini, koleksi pencarian vektor publik dan indeks vektor disiapkan untuk Anda dengan bidang yang diperlukan dan konfigurasi yang diperlukan. Setelah koleksi dibuat, Anda dapat mengelolanya di konsol Amazon OpenSearch Tanpa Server atau melalui API. AWS Untuk informasi selengkapnya, lihat Bekerja dengan koleksi pencarian vektor di Panduan Pengembang OpenSearch Layanan Amazon. Jika Anda memilih opsi ini, Anda dapat mengaktifkan pengaturan berikut secara opsional:

      1. Untuk mengaktifkan replika aktif yang berlebihan, sehingga ketersediaan penyimpanan vektor Anda tidak terganggu jika terjadi kegagalan infrastruktur, pilih Aktifkan redundansi (replika aktif).

        catatan

        Kami menyarankan Anda membiarkan opsi ini dinonaktifkan saat Anda menguji basis pengetahuan Anda. Saat Anda siap untuk menerapkan ke produksi, kami sarankan Anda mengaktifkan replika aktif yang berlebihan. Untuk informasi tentang harga, lihat Harga untuk Tanpa OpenSearch Server

      2. Untuk mengenkripsi penyimpanan vektor otomatis dengan kunci yang dikelola pelanggan, pilih Tambahkan kunci KMS yang dikelola pelanggan untuk vektor Amazon OpenSearch Tanpa Server — opsional dan pilih kuncinya. Untuk informasi selengkapnya, lihat Enkripsi informasi yang diteruskan ke Amazon OpenSearch Service.

    • Pilih penyimpanan vektor yang telah Anda buat — Pilih layanan yang berisi database vektor yang telah Anda buat. Isi kolom untuk memungkinkan Amazon Bedrock memetakan informasi dari basis pengetahuan ke database Anda, sehingga dapat menyimpan, memperbarui, dan mengelola embeddings. Untuk informasi selengkapnya tentang cara bidang ini dipetakan ke bidang yang Anda buat, lihatSiapkan indeks vektor untuk basis pengetahuan Anda di penyimpanan vektor yang didukung.

      catatan

      Jika Anda menggunakan database di Amazon OpenSearch Tanpa Server, Amazon Aurora, atau MongoDB Atlas, Anda harus mengonfigurasi bidang di bawah Pemetaan bidang sebelumnya. Jika Anda menggunakan database di Pinecone atauRedis Enterprise Cloud, Anda dapat memberikan nama untuk bidang ini di sini dan Amazon Bedrock akan membuatnya secara dinamis di penyimpanan vektor untuk Anda.

  8. Pilih Selanjutnya.

  9. Pada halaman Tinjau dan buat, periksa konfigurasi dan detail basis pengetahuan Anda. Pilih Edit di bagian mana pun yang perlu Anda ubah. Ketika Anda puas, pilih Buat basis pengetahuan.

  10. Waktu yang dibutuhkan untuk membuat basis pengetahuan tergantung pada jumlah data yang Anda berikan. Ketika basis pengetahuan selesai dibuat, Status basis pengetahuan berubah menjadi Siap.

API

Untuk membuat basis pengetahuan, kirim CreateKnowledgeBasepermintaan dengan titik akhir waktu pembuatan Agen untuk Amazon Bedrock dan berikan nama, deskripsi, instruksi untuk apa yang harus dilakukan, dan model dasar untuk mengaturnya.

catatan

Jika Anda lebih suka membiarkan Amazon Bedrock membuat dan mengelola penyimpanan vektor untuk Anda di Amazon OpenSearch Service, gunakan konsol. Untuk informasi selengkapnya, lihat Buat basis pengetahuan.

  • Berikan ARN izin untuk membuat basis pengetahuan di lapangan. roleArn

  • Berikan model embedding untuk digunakan di embeddingModelArn bidang di knowledgeBaseConfiguration objek.

  • Berikan konfigurasi untuk penyimpanan vektor Anda di storageConfiguration objek. Untuk informasi selengkapnya, lihat Siapkan indeks vektor untuk basis pengetahuan Anda di penyimpanan vektor yang didukung

    • Untuk database Amazon OpenSearch Service, gunakan opensearchServerlessConfiguration objek.

    • Untuk Pinecone database, gunakan pineconeConfiguration objek.

    • Untuk Redis Enterprise Cloud database, gunakan redisEnterpriseCloudConfiguration objek.

    • Untuk database Amazon Aurora, gunakan objek. rdsConfiguration

    • Untuk database MongoDB Atlas, gunakan objek. mongodbConfiguration

Setelah Anda membuat basis pengetahuan, buat sumber data dari bucket S3 yang berisi file untuk basis pengetahuan Anda. Untuk membuat sumber data, kirim CreateDataSourcepermintaan.

  • Berikan informasi untuk bucket S3 yang berisi file sumber data di dataSourceConfiguration lapangan.

  • Tentukan cara memotong sumber data di vectorIngestionConfiguration lapangan. Untuk informasi selengkapnya, lihat Siapkan sumber data untuk basis pengetahuan Anda.

    catatan

    Anda tidak dapat mengubah konfigurasi chunking setelah membuat sumber data.

  • Berikan sumber data Anda. dataDeletionPolicy Anda dapat DELETE semua data dasar milik sumber data dari penyimpanan vektor setelah penghapusan basis pengetahuan atau sumber daya sumber data. Perhatikan bahwa penyimpanan vektor itu sendiri tidak dihapus, hanya data yang mendasarinya. Bendera ini diabaikan jika AWS akun dihapus. Anda dapat RETAIN semua data yang mendasari di penyimpanan vektor Anda setelah penghapusan basis pengetahuan atau sumber daya sumber data.

  • (Opsional) Saat mengonversi data Anda menjadi embeddings, Amazon Bedrock mengenkripsi data Anda dengan kunci AWS yang memiliki dan mengelola, secara default. Untuk menggunakan kunci KMS Anda sendiri, sertakan dalam serverSideEncryptionConfiguration objek. Untuk informasi selengkapnya, lihat Enkripsi sumber daya basis pengetahuan.

Siapkan konfigurasi keamanan untuk basis pengetahuan Anda

Setelah membuat basis pengetahuan, Anda mungkin harus menyiapkan konfigurasi keamanan berikut:

Menyiapkan kebijakan akses data untuk basis pengetahuan Anda

Jika Anda menggunakan peran khusus, siapkan konfigurasi keamanan untuk basis pengetahuan yang baru dibuat. Jika Anda membiarkan Amazon Bedrock membuat peran layanan untuk Anda, Anda dapat melewati langkah ini. Ikuti langkah-langkah di tab yang sesuai dengan database yang Anda atur.

Amazon OpenSearch Serverless

Untuk membatasi akses ke koleksi Amazon OpenSearch Tanpa Server ke peran layanan basis pengetahuan, buat kebijakan akses data. Anda dapat melakukannya dengan cara-cara berikut:

Gunakan kebijakan akses data berikut, yang menentukan koleksi Amazon OpenSearch Tanpa Server dan peran layanan Anda:

[ { "Description": "${data access policy description}", "Rules": [ { "Resource": [ "index/${collection_name}/*" ], "Permission": [ "aoss:DescribeIndex", "aoss:ReadDocument", "aoss:WriteDocument" ], "ResourceType": "index" } ], "Principal": [ "arn:aws:iam::${account-id}:role/${kb-service-role}" ] } ]
Biji pinus, Awan Perusahaan Redis or MongoDB Atlas

Untuk mengintegrasikanPinecone,Redis Enterprise Cloud, indeks vektor MongoDB Atlas, lampirkan kebijakan berbasis identitas berikut ke peran layanan basis pengetahuan Anda untuk memungkinkannya mengakses rahasia untuk indeks vektor. AWS Secrets Manager

{ "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Action": [ "bedrock:AssociateThirdPartyKnowledgeBase" ], "Resource": "*", "Condition": { "StringEquals": { "bedrock:ThirdPartyKnowledgeBaseCredentialsSecretArn": "arn:aws:iam::${region}:${account-id}:secret:${secret-id}" } } }] }

Menyiapkan kebijakan akses jaringan untuk basis pengetahuan Amazon OpenSearch Tanpa Server

Jika Anda menggunakan koleksi Amazon OpenSearch Tanpa Server pribadi untuk basis pengetahuan Anda, itu hanya dapat diakses melalui titik akhir VPC AWS PrivateLink . Anda dapat membuat koleksi Amazon OpenSearch Tanpa Server pribadi saat menyiapkan koleksi vektor Amazon OpenSearch Tanpa Server atau membuat koleksi Amazon Tanpa OpenSearch Server yang ada (termasuk yang dibuat oleh konsol Amazon Bedrock untuk Anda) saat mengonfigurasi kebijakan akses jaringannya.

Sumber daya berikut dalam Panduan Pengembang OpenSearch Layanan Amazon akan membantu Anda memahami penyiapan yang diperlukan untuk koleksi Private Amazon OpenSearch Tanpa Server:

  • Untuk informasi selengkapnya tentang menyiapkan titik akhir VPC untuk koleksi Amazon Tanpa OpenSearch Server pribadi, lihat Mengakses Amazon OpenSearch Tanpa Server menggunakan titik akhir antarmuka ().AWS PrivateLink

  • Untuk informasi selengkapnya tentang kebijakan akses jaringan di Amazon OpenSearch Tanpa Server, lihat Akses jaringan untuk Amazon OpenSearch Tanpa Server.

Untuk mengizinkan basis pengetahuan Amazon Bedrock mengakses koleksi Amazon OpenSearch Tanpa Server pribadi, Anda harus mengedit kebijakan akses jaringan untuk koleksi Amazon Tanpa OpenSearch Server untuk mengizinkan Amazon Bedrock sebagai layanan sumber. Pilih tab yang sesuai dengan metode pilihan Anda dan ikuti langkah-langkahnya.

Console
  1. Buka konsol OpenSearch Layanan Amazon di https://console.aws.amazon.com/aos/.

  2. Dari panel navigasi kiri, pilih Koleksi. Kemudian pilih koleksi Anda.

  3. Di bagian Jaringan, pilih Kebijakan Terkait.

  4. Pilih Edit.

  5. Untuk memilih metode definisi kebijakan, lakukan salah satu hal berikut:

    • Biarkan Pilih metode definisi kebijakan sebagai Editor visual dan konfigurasikan pengaturan berikut di bagian Aturan 1:

      1. (Opsional) Di bidang Nama aturan, masukkan nama untuk aturan akses jaringan.

      2. Di bawah Akses koleksi dari, pilih Pribadi (disarankan).

      3. Pilih AWS layanan akses pribadi. Di kotak teks, masukkanbedrock.amazonaws.com.

      4. Batalkan pilihan Aktifkan akses ke OpenSearch Dasbor.

    • Pilih JSON dan tempel kebijakan berikut di editor JSON.

      [ { "AllowFromPublic": false, "Description":"${network access policy description}", "Rules":[ { "ResourceType": "collection", "Resource":[ "collection/${collection-id}" ] }, ], "SourceServices":[ "bedrock.amazonaws.com" ] } ]
  6. Pilih Perbarui.

API

Untuk mengedit kebijakan akses jaringan untuk koleksi Amazon OpenSearch Tanpa Server, lakukan hal berikut:

  1. Kirim GetSecurityPolicypermintaan dengan titik akhir OpenSearch Tanpa Server. Tentukan name kebijakan dan tentukan type sebagainetwork. Catat policyVersion dalam respons.

  2. Kirim UpdateSecurityPolicypermintaan dengan titik akhir OpenSearch Tanpa Server. Minimal, tentukan bidang-bidang berikut:

    Bidang Deskripsi
    nama Nama kebijakan
    PolicyVersion Yang policyVersion dikembalikan kepada Anda dari GetSecurityPolicy tanggapan.
    jenis Jenis kebijakan keamanan. Tentukan network.
    kebijakan Kebijakan untuk digunakan. Tentukan objek JSON berikut
    [ { "AllowFromPublic": false, "Description":"${network access policy description}", "Rules":[ { "ResourceType": "collection", "Resource":[ "collection/${collection-id}" ] }, ], "SourceServices":[ "bedrock.amazonaws.com" ] } ]

AWS CLI Sebagai contoh, lihat Membuat kebijakan akses data (AWS CLI).

  • Gunakan konsol OpenSearch Layanan Amazon dengan mengikuti langkah-langkah di Membuat kebijakan jaringan (konsol). Alih-alih membuat kebijakan jaringan, perhatikan kebijakan terkait di subbagian Jaringan dari rincian koleksi.