Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Untuk menyimpan embeddings vektor tempat dokumen Anda dikonversi, Anda menggunakan penyimpanan vektor. Jika Anda lebih suka Amazon Bedrock untuk secara otomatis membuat indeks vektor di Amazon OpenSearch Tanpa Server untuk Anda, lewati prasyarat ini dan lanjutkan ke. Buat basis pengetahuan di Amazon Bedrock Knowledge Bases
Jika Anda ingin menyimpan penyematan vektor biner alih-alih penyematan vektor floating-point (float32) standar, maka Anda harus menggunakan penyimpanan vektor yang mendukung vektor biner. Amazon OpenSearch Serverless saat ini adalah satu-satunya penyimpanan vektor yang mendukung penyimpanan vektor biner.
Anda dapat mengatur penyimpanan vektor Anda sendiri yang didukung untuk mengindeks representasi embeddings vektor data Anda. Anda membuat bidang untuk data berikut:
-
Bidang untuk vektor yang dihasilkan dari teks di sumber data Anda dengan model embeddings yang Anda pilih.
-
Bidang untuk potongan teks yang diekstrak dari file di sumber data Anda.
-
Bidang untuk metadata file sumber yang dikelola Amazon Bedrock.
-
(Jika Anda menggunakan database Amazon Aurora dan ingin mengatur pemfilteran pada metadata) Bidang untuk metadata yang Anda kaitkan dengan file sumber Anda. Jika Anda berencana untuk mengatur pemfilteran di toko vektor lain, Anda tidak perlu menyiapkan bidang ini untuk pemfilteran.
Anda dapat mengenkripsi toko vektor pihak ketiga dengan KMS kunci. Untuk informasi selengkapnya, lihat Enkripsi sumber daya basis pengetahuan.
Pilih tab yang sesuai dengan layanan penyimpanan vektor yang akan Anda gunakan untuk membuat indeks vektor Anda.
-
Untuk mengonfigurasi izin dan membuat koleksi pencarian vektor di Amazon OpenSearch Tanpa Server di AWS Management Console, ikuti langkah 1 dan 2 di Bekerja dengan koleksi pencarian vektor di Panduan Pengembang OpenSearch Layanan Amazon. Perhatikan pertimbangan berikut saat menyiapkan koleksi Anda:
-
Berikan koleksi nama dan deskripsi pilihan Anda.
-
Untuk membuat koleksi Anda pribadi, pilih Standard create for the Security. Kemudian, di bagian Pengaturan akses jaringan, pilih VPCsebagai jenis Akses dan pilih VPC titik akhir. Untuk informasi selengkapnya tentang menyiapkan VPC titik akhir untuk koleksi Amazon OpenSearch Tanpa Server, lihat Mengakses Amazon OpenSearch Tanpa Server menggunakan titik akhir antarmuka ()AWS PrivateLink di Panduan Pengembang Layanan Amazon. OpenSearch
-
-
Setelah koleksi dibuat, perhatikan Koleksi ARN saat Anda membuat basis pengetahuan.
-
Di panel navigasi kiri, pilih Koleksi di bawah Tanpa Server. Kemudian pilih koleksi pencarian vektor Anda.
-
Pilih tab Indeks. Kemudian pilih Buat indeks vektor.
-
Di bagian Detail indeks vektor, masukkan nama untuk indeks Anda di bidang nama indeks vektor.
-
Di bagian Bidang vektor, pilih Tambahkan bidang vektor. Amazon Bedrock menyimpan embeddings vektor untuk sumber data Anda di bidang ini. Berikan konfigurasi berikut:
-
Nama bidang vektor — Berikan nama untuk bidang (misalnya,
embeddings
). -
Mesin — Mesin vektor yang digunakan untuk pencarian. Pilih Faiss.
-
Dimensi — Jumlah dimensi dalam vektor. Lihat tabel berikut untuk menentukan berapa banyak dimensi yang harus dikandung vektor:
Model Dimensi Titan Embeddings G1 - Teks 1,536 Titan V2 Embeddings - Teks 1,024 Cohere Embed Bahasa Inggris 1,024 Cohere Embed Multilingual 1,024 -
Metrik jarak — Metrik yang digunakan untuk mengukur kesamaan antara vektor. Kami merekomendasikan menggunakan Euclidean.
-
-
Perluas bagian manajemen Metadata dan tambahkan dua bidang untuk mengonfigurasi indeks vektor untuk menyimpan metadata tambahan yang dapat diambil oleh basis pengetahuan dengan vektor. Tabel berikut menjelaskan bidang dan nilai yang akan ditentukan untuk setiap bidang:
Deskripsi bidang Bidang pemetaan Tipe data Dapat disaring Amazon Bedrock memotong teks mentah dari data Anda dan menyimpan potongan di bidang ini. Nama pilihan Anda (misalnya, text
)String True Amazon Bedrock menyimpan metadata yang terkait dengan basis pengetahuan Anda di bidang ini. Nama pilihan Anda (misalnya, bedrock-metadata
)String False -
Catat nama yang Anda pilih untuk nama indeks vektor, nama bidang vektor, dan nama bidang pemetaan manajemen metadata saat Anda membuat basis pengetahuan. Lalu pilih Buat.
Setelah indeks vektor dibuat, Anda dapat melanjutkan untuk membuat basis pengetahuan Anda. Tabel berikut merangkum di mana Anda akan memasukkan setiap informasi yang Anda catat.
Bidang | Bidang yang sesuai dalam pengaturan basis pengetahuan (Konsol) | Bidang yang sesuai dalam pengaturan basis pengetahuan (API) | Deskripsi |
---|---|---|---|
Koleksi ARN | Koleksi ARN | koleksi ARN | Nama Sumber Daya Amazon (ARN) dari koleksi pencarian vektor. |
Nama indeks vektor | Nama indeks vektor | vectorIndexName | Nama indeks vektor. |
Nama bidang vektor | Bidang vektor | vectorField | Nama bidang tempat menyimpan embeddings vektor untuk sumber data Anda. |
Manajemen metadata (bidang pemetaan pertama) | Bidang teks | textField | Nama bidang untuk menyimpan teks mentah dari sumber data Anda. |
Manajemen metadata (bidang pemetaan kedua) | Bidang metadata yang dikelola batuan dasar | metadataField | Nama bidang tempat menyimpan metadata yang dikelola Amazon Bedrock. |
Untuk dokumentasi lebih rinci tentang menyiapkan penyimpanan vektor di Amazon OpenSearch Tanpa Server, lihat Bekerja dengan koleksi pencarian vektor di Panduan Pengembang OpenSearch Layanan Amazon.