Prasyarat untuk menggunakan penyimpanan vektor yang Anda buat untuk basis pengetahuan

Mode fokus

Prasyarat untuk menggunakan penyimpanan vektor yang Anda buat untuk basis pengetahuan - Amazon Bedrock

Untuk menyimpan embeddings vektor tempat dokumen Anda dikonversi, Anda menggunakan penyimpanan vektor. Jika Anda lebih suka Amazon Bedrock untuk secara otomatis membuat indeks vektor di Amazon OpenSearch Tanpa Server untuk Anda, lewati prasyarat ini dan lanjutkan ke. Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases

Jika Anda ingin menyimpan embeddings vektor biner alih-alih embeddings vektor floating-point (float32) standar, maka Anda harus menggunakan penyimpanan vektor yang mendukung vektor biner.

catatan

Amazon OpenSearch Serverless dan Amazon OpenSearch Managed cluster adalah satu-satunya penyimpanan vektor yang mendukung penyimpanan vektor biner.

Anda dapat mengatur penyimpanan vektor Anda sendiri yang didukung untuk mengindeks representasi embeddings vektor data Anda. Anda membuat bidang untuk data berikut:

Bidang untuk vektor yang dihasilkan dari teks di sumber data Anda dengan model embeddings yang Anda pilih.
Bidang untuk potongan teks yang diekstrak dari file di sumber data Anda.
Bidang untuk metadata file sumber yang dikelola Amazon Bedrock.
(Jika Anda menggunakan database Amazon Aurora dan ingin mengatur pemfilteran pada metadata) Bidang untuk metadata yang Anda kaitkan dengan file sumber Anda. Jika Anda berencana untuk mengatur pemfilteran di toko vektor lain, Anda tidak perlu menyiapkan bidang ini untuk pemfilteran.

Anda dapat mengenkripsi toko vektor pihak ketiga dengan kunci KMS. Untuk informasi selengkapnya, lihat Enkripsi sumber daya basis pengetahuan.

Pilih tab yang sesuai dengan layanan penyimpanan vektor yang akan Anda gunakan untuk membuat indeks vektor Anda.

Amazon OpenSearch Serverless

Untuk mengonfigurasi izin dan membuat koleksi pencarian vektor di Amazon OpenSearch Tanpa Server di AWS Management Console, ikuti langkah 1 dan 2 di Bekerja dengan koleksi pencarian vektor di Panduan Pengembang OpenSearch Layanan Amazon. Perhatikan pertimbangan berikut saat menyiapkan koleksi Anda:
1. Berikan koleksi nama dan deskripsi pilihan Anda.
2. Untuk membuat koleksi Anda pribadi, pilih Standard create for the Security. Kemudian, di bagian Pengaturan akses jaringan, pilih VPC sebagai jenis Akses dan pilih titik akhir VPC. Untuk informasi selengkapnya tentang menyiapkan titik akhir VPC untuk koleksi Amazon OpenSearch Tanpa Server, lihat Mengakses Amazon OpenSearch Tanpa Server menggunakan titik akhir antarmuka ()AWS PrivateLink di Panduan Pengembang Layanan Amazon. OpenSearch
Setelah koleksi dibuat, perhatikan ARN Koleksi saat Anda membuat basis pengetahuan.
Di panel navigasi kiri, pilih Koleksi di bawah Tanpa Server. Kemudian pilih koleksi pencarian vektor Anda.
Pilih tab Indeks. Kemudian pilih Buat indeks vektor.
Di bagian Detail indeks vektor, masukkan nama untuk indeks Anda di bidang nama indeks vektor.

Di bagian Bidang vektor, pilih Tambahkan bidang vektor. Amazon Bedrock menyimpan embeddings vektor untuk sumber data Anda di bidang ini. Berikan konfigurasi berikut:

Nama bidang vektor — Berikan nama untuk bidang (misalnya,embeddings).
Mesin — Mesin vektor yang digunakan untuk pencarian. Pilih Faiss.

Dimensi — Jumlah dimensi dalam vektor. Lihat tabel berikut untuk menentukan berapa banyak dimensi yang harus dikandung vektor:

Model	Dimensi
Titan Embeddings G1 - Teks	1,536
Titan V2 Embeddings - Teks	1.024, 512, dan 256
Cohere Embed Bahasa Inggris	1,024
Cohere Embed Multibahasa	1,024

Metrik jarak — Metrik yang digunakan untuk mengukur kesamaan antara vektor. Kami merekomendasikan penggunaan Euclidean untuk penyematan vektor floating-point.

Perluas bagian manajemen Metadata dan tambahkan dua bidang untuk mengonfigurasi indeks vektor untuk menyimpan metadata tambahan yang dapat diambil oleh basis pengetahuan dengan vektor. Tabel berikut menjelaskan bidang dan nilai yang akan ditentukan untuk setiap bidang:

Deskripsi bidang	Bidang pemetaan	Jenis data	Dapat disaring
Amazon Bedrock memotong teks mentah dari data Anda dan menyimpan potongan di bidang ini.	Nama pilihan Anda (misalnya,`text`)	String	True
Amazon Bedrock menyimpan metadata yang terkait dengan basis pengetahuan Anda di bidang ini.	Nama pilihan Anda (misalnya,`bedrock-metadata`)	String	False

Catat nama yang Anda pilih untuk nama indeks vektor, nama bidang vektor, dan nama bidang pemetaan manajemen metadata saat Anda membuat basis pengetahuan. Lalu pilih Buat.

Setelah indeks vektor dibuat, Anda dapat melanjutkan untuk membuat basis pengetahuan Anda. Tabel berikut merangkum di mana Anda akan memasukkan setiap informasi yang Anda catat.

Bidang	Bidang yang sesuai dalam pengaturan basis pengetahuan (Konsol)	Bidang yang sesuai dalam pengaturan basis pengetahuan (API)	Deskripsi
Koleksi ARN	Koleksi ARN	CollectionARN	Nama Sumber Daya Amazon (ARN) dari koleksi pencarian vektor.
Nama indeks vektor	Nama indeks vektor	vectorIndexName	Nama indeks vektor.
Nama bidang vektor	Bidang vektor	VectorField	Nama bidang tempat menyimpan embeddings vektor untuk sumber data Anda.
Manajemen metadata (bidang pemetaan pertama)	Bidang teks	TextField	Nama bidang untuk menyimpan teks mentah dari sumber data Anda.
Manajemen metadata (bidang pemetaan kedua)	Bidang metadata yang dikelola batuan dasar	MetaDataField	Nama bidang tempat menyimpan metadata yang dikelola Amazon Bedrock.

Untuk dokumentasi lebih rinci tentang menyiapkan penyimpanan vektor di Amazon OpenSearch Tanpa Server, lihat Bekerja dengan koleksi pencarian vektor di Panduan Pengembang OpenSearch Layanan Amazon.

Amazon OpenSearch Service Managed Clusters

penting

Sebelum menggunakan sumber daya domain apa pun di kluster OpenSearch Terkelola, Anda perlu mengonfigurasi izin dan kebijakan akses IAM tertentu. Untuk informasi selengkapnya, lihat Prasyarat dan izin yang diperlukan untuk menggunakan OpenSearch Kluster Terkelola dengan Pangkalan Pengetahuan Amazon Bedrock.
Jika Anda mengalami kegagalan konsumsi data, ini mungkin menunjukkan kapasitas OpenSearch domain yang tidak mencukupi. Untuk mengatasi masalah ini, tingkatkan kapasitas domain Anda dengan menyediakan IOPS yang lebih tinggi dan dengan meningkatkan pengaturan throughput. Untuk informasi selengkapnya, lihat Praktik terbaik operasional untuk OpenSearch Layanan Amazon.

Untuk membuat indeks domain dan vektor di OpenSearch Cluster AWS Management Console, ikuti langkah-langkah yang dijelaskan dalam Membuat dan mengelola domain OpenSearch Layanan di Panduan Pengembang OpenSearch Layanan Amazon.

Perhatikan pertimbangan berikut saat menyiapkan domain Anda:
1. Berikan nama domain pilihan Anda.
2. Kami menyarankan Anda menggunakan opsi Easy create untuk memulai dengan cepat dengan membuat domain Anda.
  
  catatan
  Opsi ini memberi Anda domain dengan throughput rendah. Jika Anda memiliki beban kerja yang lebih besar yang memerlukan throughput lebih tinggi, pilih opsi Buat Standar. Anda dapat menyesuaikan kapasitas nanti sesuai kebutuhan. Dengan opsi ini, Anda dapat mulai dengan kapasitas terendah, yang kemudian dapat dimodifikasi nanti sesuai kebutuhan.
3. Untuk Jaringan, Anda harus memilih Akses publik. OpenSearch domain yang berada di belakang VPC tidak didukung untuk Basis Pengetahuan Anda.
4. Untuk Versi, jika Anda menggunakan embeddings vektor biner, Amazon Bedrock Knowledge Bases memerlukan versi Engine 2.16 atau yang lebih baru. Selain itu, versi 2.13 atau lebih tinggi diperlukan untuk membuat indeks k-nn. Untuk informasi selengkapnya, lihat Penelusuran K-NN di panduan pengembang OpenSearch Layanan Amazon.
5. Kami menyarankan Anda menggunakan mode Dual-stack.
6. Kami menyarankan Anda mengaktifkan kontrol akses berbutir halus untuk melindungi data di domain Anda, dan lebih lanjut mengontrol izin yang memberikan akses peran layanan basis Pengetahuan Anda ke domain dan membuat permintaan. OpenSearch
7. Biarkan semua pengaturan lain ke nilai defaultnya dan pilih Buat untuk membuat domain Anda.
Setelah domain dibuat, klik untuk mencatat domain ARN dan titik akhir Domain saat Anda membuat basis pengetahuan.

Setelah membuat domain, Anda dapat membuat indeks vektor dengan menjalankan perintah berikut di OpenSearch dasbor atau menggunakan perintah curl. Lihat informasi yang lebih lengkap dalam dokumentasi OpenSearch .

Saat menjalankan perintah:

Berikan nama untuk bidang vektor (misalnya,embeddings).
Pastikan bahwa vektor yang digunakan untuk pencarian adalah faiss. nmslib tidak didukung.

Untuk jumlah dimensi dalam vektor, lihat tabel berikut untuk menentukan berapa banyak dimensi yang harus dikandung vektor:

catatan

Titan V2 Embeddings - Model teks mendukung banyak dimensi. Bisa juga 256 atau 512.

Model	Dimensi
Titan Embeddings G1 - Teks	1,536
Titan V2 Embeddings - Teks	1.024, 512, dan 256
Cohere Embed Bahasa Inggris	1,024
Cohere Embed Multibahasa	1,024

Anda dapat menambahkan dua bidang untuk mengonfigurasi indeks vektor untuk menyimpan metadata tambahan yang dapat diambil oleh basis pengetahuan dengan vektor. Tabel berikut menjelaskan bidang dan nilai yang akan ditentukan untuk masing-masing bidang.

Deskripsi bidang	Bidang pemetaan
Amazon Bedrock memotong teks mentah dari data Anda dan menyimpan potongan di bidang ini.	Ditentukan sebagai objek, misalnya,`AMAZON_BEDROCK_TEXT_CHUNK`.
Amazon Bedrock menyimpan metadata yang terkait dengan basis pengetahuan Anda di bidang ini.	Ditentukan sebagai objek, misalnya,`AMAZON_BEDROCK_METADATA`.


PUT /<index-name>
{
    "settings": {
        "index": {
            "knn": true
        }
    },
    "mappings": {
        "properties": {
            "<vector-name>": {
                "type": "knn_vector",
                "dimension": <embedding-dimension>,
                "data_type": "binary",          # Only needed for binary embeddings
                "space_type": "l2" | "hamming", # Use l2 for float embeddings and hamming for binary embeddings
                "method": {
                    "name": "hnsw",
                    "engine": "faiss",
                    "parameters": {
                        "ef_construction": 128,
                        "m": 24
                    }
                }
            },

            "AMAZON_BEDROCK_METADATA": {
                "type": "text",
                "index": "false"
            },
            "AMAZON_BEDROCK_TEXT_CHUNK": {
                "type": "text",
                "index": "true"            
            }
        }
    }
}

Catat ARN domain dan titik akhir, dan nama yang Anda pilih untuk nama indeks vektor, nama bidang vektor, dan nama bidang pemetaan manajemen metadata saat Anda membuat basis pengetahuan Anda.

Setelah indeks vektor dibuat, Anda dapat melanjutkan untuk membuat basis pengetahuan Anda. Tabel berikut merangkum di mana Anda akan memasukkan setiap informasi yang Anda catat.

Bidang	Bidang yang sesuai dalam pengaturan basis pengetahuan (Konsol)	Bidang yang sesuai dalam pengaturan basis pengetahuan (API)	Deskripsi
Domain ARN	Domain ARN	DomainARN	Nama Sumber Daya Amazon (ARN) dari domain. OpenSearch
Titik akhir domain	Titik akhir domain	DomainEndPoint	Endpoint untuk terhubung ke OpenSearch domain.
Nama indeks vektor	Nama indeks vektor	vectorIndexName	Nama indeks vektor.
Nama bidang vektor	Bidang vektor	VectorField	Nama bidang tempat menyimpan embeddings vektor untuk sumber data Anda.
Manajemen metadata (bidang pemetaan pertama)	Bidang teks	TextField	Nama bidang untuk menyimpan teks mentah dari sumber data Anda.
Manajemen metadata (bidang pemetaan kedua)	Bidang metadata yang dikelola batuan dasar	MetaDataField	Nama bidang tempat menyimpan metadata yang dikelola Amazon Bedrock.

Amazon Aurora (RDS)

Buat klaster, skema, dan tabel database Amazon Aurora (DB) dengan mengikuti langkah-langkah di Menggunakan Aurora PostgreSQL sebagai basis pengetahuan. Saat Anda membuat tabel, konfigurasikan dengan kolom dan tipe data berikut. Anda dapat menggunakan nama kolom yang Anda sukai, bukan yang tercantum dalam tabel berikut. Catat nama kolom yang Anda pilih sehingga Anda dapat memberikannya selama pengaturan basis pengetahuan.

Nama kolom	Jenis data	Bidang yang sesuai dalam pengaturan basis pengetahuan (Konsol)	Bidang yang sesuai dalam pengaturan basis pengetahuan (API)	Deskripsi
id	Kunci utama UUID	Kunci primer	`primaryKeyField`	Berisi pengidentifikasi unik untuk setiap catatan.
menyematkan	vektor	Bidang vektor	`vectorField`	Berisi embeddings vektor dari sumber data.
potongan	Teks	Bidang teks	`textField`	Berisi potongan teks mentah dari sumber data Anda.
Metadata	JSON	Bidang metadata yang dikelola batuan dasar	`metadataField`	Berisi metadata yang diperlukan untuk melakukan atribusi sumber dan untuk mengaktifkan penyerapan dan kueri data

(Opsional) Jika Anda menambahkan metadata ke file Anda untuk pemfilteran, Anda juga harus membuat kolom untuk setiap atribut metadata dalam file Anda dan menentukan tipe data (teks, angka, atau boolean). Misalnya, jika atribut genre ada di sumber data Anda, Anda akan menambahkan kolom bernama genre dan menentukan text sebagai tipe data. Selama konsumsi data, kolom ini akan diisi dengan nilai atribut yang sesuai.
Konfigurasikan AWS Secrets Manager rahasia untuk cluster Aurora DB Anda dengan mengikuti langkah-langkah di Manajemen kata sandi dengan Amazon Aurora dan. AWS Secrets Manager

Catat informasi berikut setelah Anda membuat cluster DB dan mengatur rahasianya.

Bidang dalam pengaturan basis pengetahuan (Konsol)	Bidang dalam pengaturan basis pengetahuan (API)	Deskripsi
Amazon Aurora DB Cluster ARN	resourceArn	ARN dari cluster DB Anda.
Nama basis data	databaseName	Nama database Anda
Nama tabel	tableName	Nama tabel di cluster DB Anda
Rahasia ARN	credentialsSecretArn	ARN AWS Secrets Manager kunci untuk cluster DB Anda

Neptune Analytics graphs (GraphRAG)

Untuk membuat penyimpanan grafik dan vektor di Neptunus Analytics di, ikuti langkah-langkah yang dijelaskan dalam AWS Management ConsolePengindeksan vektor di Neptunus Analytics di Panduan Pengguna Neptunus Analytics.

catatan

Untuk menggunakan Neptune GraphRag, buat grafik Neptunus Analytics kosong dengan indeks pencarian vektor. Indeks pencarian vektor hanya dapat dibuat ketika grafik dibuat. Saat membuat grafik Neptunus Analytics di konsol, Anda menentukan dimensi indeks di bawah Pengaturan pencarian vektor di dekat akhir proses.

Perhatikan pertimbangan berikut saat membuat grafik:

Berikan grafik nama pilihan Anda.
Di bawah Sumber data, pilih Buat grafik kosong, dan tentukan jumlah m- NCUs yang akan dialokasikan. Setiap m-NCU memiliki sekitar satu GiB kapasitas memori dan komputasi dan jaringan yang sesuai.

catatan
Kapasitas grafik Anda dapat dimodifikasi nanti. Kami menyarankan Anda memulai dengan instance terkecil dan kemudian memilih instance yang berbeda, jika diperlukan.
Anda dapat meninggalkan pengaturan ketersediaan default, dan di bawah Jaringan dan Keamanan, Anda harus mengaktifkan akses publik. Grafik Neptunus Analytics di belakang VPC tidak didukung.

Di bawah Pengaturan pencarian vektor, pilih Gunakan dimensi vektor dan tentukan jumlah dimensi di setiap vektor.

catatan

Jumlah dimensi di setiap vektor harus sesuai dengan dimensi vektor dalam model embeddings. Lihat tabel berikut untuk menentukan berapa banyak dimensi yang harus dikandung vektor:

Model	Dimensi
Titan Embeddings G1 - Teks	1,536
Titan V2 Embeddings - Teks	1.024, 512, dan 256
Cohere Embed Bahasa Inggris	1,024
Cohere Embed Multibahasa	1,024

Biarkan semua pengaturan lain ke default dan buat grafik.

Setelah grafik dibuat, klik untuk mencatat dimensi ARN Sumber Daya dan Vektor saat Anda membuat basis pengetahuan.

Perluas bagian manajemen Metadata dan tambahkan dua bidang untuk mengonfigurasi indeks vektor untuk menyimpan metadata tambahan yang dikelola oleh Amazon Bedrock. Tabel berikut menjelaskan bidang dan nilai yang akan ditentukan untuk setiap bidang:

Deskripsi bidang	Bidang pemetaan	Jenis data	Dapat disaring
Amazon Bedrock memotong teks mentah dari data Anda dan menyimpan potongan di bidang ini.	Nama pilihan Anda (misalnya,`text`)	String	True
Amazon Bedrock menyimpan metadata yang terkait dengan basis pengetahuan Anda di bidang ini, seperti lokasi Amazon S3 dari file yang berisi teks ini.	Nama pilihan Anda (misalnya,`bedrock-metadata`)	String	False

Catat nama yang Anda pilih untuk nama indeks vektor, nama bidang vektor, dan nama bidang pemetaan manajemen metadata saat Anda membuat basis pengetahuan. Lalu pilih Buat.

Setelah indeks vektor dibuat, Anda dapat melanjutkan untuk membuat basis pengetahuan Anda. Tabel berikut merangkum di mana Anda akan memasukkan setiap informasi yang Anda catat.

Bidang	Bidang yang sesuai dalam pengaturan basis pengetahuan (Konsol)	Bidang yang sesuai dalam pengaturan basis pengetahuan (API)	Deskripsi
Grafik ARN	Grafik Analitik Neptunus ARN	GraphArn	Nama Sumber Daya Amazon (ARN) dari grafik Neptunus Analytics.
Manajemen metadata (bidang pemetaan pertama)	Nama bidang teks	TextField	Nama bidang untuk menyimpan teks mentah dari sumber data Anda.
Manajemen metadata (bidang pemetaan kedua)	Bidang metadata yang dikelola batuan dasar	MetaDataField	Nama bidang tempat menyimpan metadata yang dikelola Amazon Bedrock.

Pinecone

catatan

Jika Anda menggunakan Pinecone, Anda setuju untuk mengizinkan AWS untuk mengakses sumber pihak ketiga yang ditunjuk atas nama Anda untuk menyediakan layanan penyimpanan vektor kepada Anda. Anda bertanggung jawab untuk mematuhi persyaratan pihak ketiga yang berlaku untuk penggunaan dan dan transfer data dari layanan pihak ketiga.

Untuk dokumentasi rinci tentang pengaturan penyimpanan vektor di Pinecone, lihat Biji Pinus sebagai basis pengetahuan untuk Amazon Bedrock.

Saat Anda mengatur penyimpanan vektor, perhatikan informasi berikut, yang akan Anda isi saat membuat basis pengetahuan:

Endpoint URL — URL endpoint untuk halaman manajemen indeks Anda.
Rahasia kredensyal ARN — Nama Sumber Daya Amazon (ARN) rahasia yang Anda buat di AWS Secrets Manager yang berisi nama pengguna dan kata sandi untuk pengguna database.
(Opsional) Kunci KMS yang dikelola pelanggan untuk ARN rahasia Kredensyal Anda — jika Anda mengenkripsi ARN rahasia kredensyal Anda, berikan kunci KMS sehingga Amazon Bedrock dapat mendekripsi.
Nama Space — (Opsional) Namespace yang akan digunakan untuk menulis data baru ke database Anda. Untuk informasi selengkapnya, lihat Menggunakan ruang nama.

Ada konfigurasi tambahan yang harus Anda berikan saat membuat Pinecone indeks:

Nama bidang teks - Nama bidang tempat Amazon Bedrock harus menyimpan teks potongan mentah.
Nama bidang metadata — Nama bidang tempat Amazon Bedrock harus menyimpan metadata atribusi sumber.

Untuk mengakses Anda Pinecone indeks, Anda harus memberikan Pinecone Kunci API ke Amazon Bedrock melalui. AWS Secrets Manager

Untuk membuat rahasia untuk Anda Pinecone konfigurasi

Ikuti langkah-langkah di Buat AWS Secrets Manager rahasia, atur kunci sebagai apiKey dan nilai sebagai kunci API untuk mengakses Anda Pinecone indeks.
Untuk menemukan kunci API Anda, buka konsol Pinecone Anda dan pilih Kunci API.
Setelah Anda membuat rahasia, perhatikan ARN dari kunci KMS.
Lampirkan izin ke peran layanan Anda untuk mendekripsi ARN kunci KMS dengan mengikuti langkah-langkahnya. Izin untuk mendekripsi AWS Secrets Manager rahasia untuk penyimpanan vektor yang berisi basis pengetahuan Anda
Kemudian, ketika Anda membuat basis pengetahuan Anda, masukkan ARN di bidang ARN rahasia Kredensial.

Redis Enterprise Cloud

catatan

Jika Anda menggunakan Redis Enterprise Cloud, Anda setuju untuk mengizinkan AWS untuk mengakses sumber pihak ketiga yang ditunjuk atas nama Anda untuk menyediakan layanan penyimpanan vektor kepada Anda. Anda bertanggung jawab untuk mematuhi persyaratan pihak ketiga yang berlaku untuk penggunaan dan transfer data dari layanan pihak ketiga.

Untuk dokumentasi rinci tentang pengaturan penyimpanan vektor di Redis Enterprise Cloud, lihat Mengintegrasikan Redis Enterprise Cloud dengan Amazon Bedrock.

Saat Anda mengatur penyimpanan vektor, perhatikan informasi berikut, yang akan Anda isi saat membuat basis pengetahuan:

Endpoint URL — URL endpoint publik untuk database Anda.
Nama indeks vektor — Nama indeks vektor untuk database Anda.

Bidang vektor — Nama bidang tempat penyematan vektor akan disimpan. Lihat tabel berikut untuk menentukan berapa banyak dimensi yang harus dikandung vektor.

Model	Dimensi
Titan Embeddings G1 - Teks	1,536
Titan V2 Embeddings - Teks	1.024, 512, dan 256
Cohere Embed Bahasa Inggris	1,024
Cohere Embed Multibahasa	1,024

Bidang teks — Nama bidang tempat Amazon Bedrock menyimpan potongan teks mentah.
Bidang metadata yang dikelola oleh batuan dasar — Nama bidang tempat Amazon Bedrock menyimpan metadata yang terkait dengan basis pengetahuan Anda.

Untuk mengakses Anda Redis Enterprise Cloud cluster, Anda harus memberikan Redis Enterprise Cloud konfigurasi keamanan ke Amazon Bedrock melalui. AWS Secrets Manager

Untuk membuat rahasia untuk Anda Redis Enterprise Cloud konfigurasi

Aktifkan TLS untuk menggunakan database Anda dengan Amazon Bedrock dengan mengikuti langkah-langkah di Transport Layer Security (TLS).
Ikuti langkah-langkah di Buat AWS Secrets Manager rahasia. Siapkan kunci berikut dengan nilai yang sesuai dari Anda Redis Enterprise Cloud konfigurasi dalam rahasia:
- username— Nama pengguna untuk mengakses Redis Enterprise Cloud basis data. Untuk menemukan nama pengguna Anda, lihat di bawah bagian Keamanan database Anda di Konsol Redis.
- password— Kata sandi untuk mengakses Redis Enterprise Cloud basis data. Untuk menemukan kata sandi Anda, lihat di bawah bagian Keamanan database Anda di Konsol Redis.
- serverCertificate— Isi sertifikat dari otoritas Redis Cloud Certificate. Unduh sertifikat server dari Konsol Admin Redis dengan mengikuti langkah-langkah di Unduh sertifikat.
- clientPrivateKey— Kunci pribadi sertifikat dari otoritas Redis Cloud Certificate. Unduh sertifikat server dari Konsol Admin Redis dengan mengikuti langkah-langkah di Unduh sertifikat.
- clientCertificate— Kunci publik sertifikat dari otoritas Redis Cloud Certificate. Unduh sertifikat server dari Konsol Admin Redis dengan mengikuti langkah-langkah di Unduh sertifikat.
Setelah Anda membuat rahasia, perhatikan ARN-nya. Kemudian, ketika Anda membuat basis pengetahuan Anda, masukkan ARN di bidang ARN rahasia Kredensial.

MongoDB Atlas

catatan

Jika Anda menggunakan MongoDB Atlas, Anda setuju untuk AWS mengizinkan untuk mengakses sumber pihak ketiga yang ditunjuk atas nama Anda untuk menyediakan layanan penyimpanan vektor kepada Anda. Anda bertanggung jawab untuk mematuhi persyaratan pihak ketiga yang berlaku untuk penggunaan dan dan transfer data dari layanan pihak ketiga.

Untuk dokumentasi rinci tentang menyiapkan penyimpanan vektor di MongoDB Atlas, lihat MongoDB Atlas sebagai basis pengetahuan untuk Amazon Bedrock.

Ketika Anda mengatur penyimpanan vektor, perhatikan informasi berikut yang akan Anda tambahkan ketika Anda membuat basis pengetahuan:

URL Endpoint — URL endpoint dari cluster MongoDB Atlas Anda.
Nama database — Nama database di cluster MongoDB Atlas Anda.
Nama koleksi — Nama koleksi dalam database Anda.
Rahasia kredensyal ARN - Nama Sumber Daya Amazon (ARN) rahasia yang Anda buat di AWS Secrets Manager yang berisi nama pengguna dan kata sandi untuk pengguna database di cluster MongoDB Atlas Anda.
(Opsional) Kunci KMS yang dikelola pelanggan untuk ARN rahasia Kredensyal Anda — jika Anda mengenkripsi ARN rahasia kredensyal Anda, berikan kunci KMS sehingga Amazon Bedrock dapat mendekripsi.

Ada konfigurasi tambahan untuk pemetaan Field yang harus Anda berikan saat membuat indeks MongoDB Atlas:

Nama indeks vektor — Nama Indeks Pencarian Vektor MongoDB Atlas pada koleksi Anda.
Nama bidang vektor — Nama bidang tempat Amazon Bedrock harus menyimpan embeddings vektor.
Nama bidang teks - Nama bidang tempat Amazon Bedrock harus menyimpan teks potongan mentah.
Nama bidang metadata — Nama bidang tempat Amazon Bedrock harus menyimpan metadata atribusi sumber.

(Opsional) Agar Amazon Bedrock terhubung ke cluster MongoDB Atlas Anda melalui PrivateLink AWS, lihat alur kerja RAG dengan MongoDB Atlas menggunakan Amazon Bedrock.

anchor anchor anchor anchor anchor anchor anchor

Untuk mengonfigurasi izin dan membuat koleksi pencarian vektor di Amazon OpenSearch Tanpa Server di AWS Management Console, ikuti langkah 1 dan 2 di Bekerja dengan koleksi pencarian vektor di Panduan Pengembang OpenSearch Layanan Amazon. Perhatikan pertimbangan berikut saat menyiapkan koleksi Anda:
1. Berikan koleksi nama dan deskripsi pilihan Anda.
2. Untuk membuat koleksi Anda pribadi, pilih Standard create for the Security. Kemudian, di bagian Pengaturan akses jaringan, pilih VPC sebagai jenis Akses dan pilih titik akhir VPC. Untuk informasi selengkapnya tentang menyiapkan titik akhir VPC untuk koleksi Amazon OpenSearch Tanpa Server, lihat Mengakses Amazon OpenSearch Tanpa Server menggunakan titik akhir antarmuka ()AWS PrivateLink di Panduan Pengembang Layanan Amazon. OpenSearch
Setelah koleksi dibuat, perhatikan ARN Koleksi saat Anda membuat basis pengetahuan.
Di panel navigasi kiri, pilih Koleksi di bawah Tanpa Server. Kemudian pilih koleksi pencarian vektor Anda.
Pilih tab Indeks. Kemudian pilih Buat indeks vektor.
Di bagian Detail indeks vektor, masukkan nama untuk indeks Anda di bidang nama indeks vektor.

Di bagian Bidang vektor, pilih Tambahkan bidang vektor. Amazon Bedrock menyimpan embeddings vektor untuk sumber data Anda di bidang ini. Berikan konfigurasi berikut:

Nama bidang vektor — Berikan nama untuk bidang (misalnya,embeddings).
Mesin — Mesin vektor yang digunakan untuk pencarian. Pilih Faiss.

Dimensi — Jumlah dimensi dalam vektor. Lihat tabel berikut untuk menentukan berapa banyak dimensi yang harus dikandung vektor:

Model	Dimensi
Titan Embeddings G1 - Teks	1,536
Titan V2 Embeddings - Teks	1.024, 512, dan 256
Cohere Embed Bahasa Inggris	1,024
Cohere Embed Multibahasa	1,024

Metrik jarak — Metrik yang digunakan untuk mengukur kesamaan antara vektor. Kami merekomendasikan penggunaan Euclidean untuk penyematan vektor floating-point.

Deskripsi bidang	Bidang pemetaan	Jenis data	Dapat disaring
Amazon Bedrock memotong teks mentah dari data Anda dan menyimpan potongan di bidang ini.	Nama pilihan Anda (misalnya,`text`)	String	True
Amazon Bedrock menyimpan metadata yang terkait dengan basis pengetahuan Anda di bidang ini.	Nama pilihan Anda (misalnya,`bedrock-metadata`)	String	False

Catat nama yang Anda pilih untuk nama indeks vektor, nama bidang vektor, dan nama bidang pemetaan manajemen metadata saat Anda membuat basis pengetahuan. Lalu pilih Buat.

Setelah indeks vektor dibuat, Anda dapat melanjutkan untuk membuat basis pengetahuan Anda. Tabel berikut merangkum di mana Anda akan memasukkan setiap informasi yang Anda catat.

Bidang	Bidang yang sesuai dalam pengaturan basis pengetahuan (Konsol)	Bidang yang sesuai dalam pengaturan basis pengetahuan (API)	Deskripsi
Koleksi ARN	Koleksi ARN	CollectionARN	Nama Sumber Daya Amazon (ARN) dari koleksi pencarian vektor.
Nama indeks vektor	Nama indeks vektor	vectorIndexName	Nama indeks vektor.
Nama bidang vektor	Bidang vektor	VectorField	Nama bidang tempat menyimpan embeddings vektor untuk sumber data Anda.
Manajemen metadata (bidang pemetaan pertama)	Bidang teks	TextField	Nama bidang untuk menyimpan teks mentah dari sumber data Anda.
Manajemen metadata (bidang pemetaan kedua)	Bidang metadata yang dikelola batuan dasar	MetaDataField	Nama bidang tempat menyimpan metadata yang dikelola Amazon Bedrock.

Untuk dokumentasi lebih rinci tentang menyiapkan penyimpanan vektor di Amazon OpenSearch Tanpa Server, lihat Bekerja dengan koleksi pencarian vektor di Panduan Pengembang OpenSearch Layanan Amazon.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Prasyarat untuk data basis pengetahuan Anda

Prasyarat untuk Cluster Terkelola OpenSearch

Topik berikutnya:

Prasyarat untuk Cluster Terkelola OpenSearch

Topik sebelumnya:

Prasyarat untuk data basis pengetahuan Anda

Perlu bantuan?

Pilih preferensi cookie Anda

Sesuaikan preferensi cookie

Penting

Kinerja

Fungsional

Iklan

Tidak dapat menyimpan preferensi cookie

Prasyarat untuk menggunakan penyimpanan vektor yang Anda buat untuk basis pengetahuan

catatan

penting

catatan

catatan

catatan

catatan

catatan

catatan

Untuk membuat rahasia untuk Anda Pinecone konfigurasi

catatan

Untuk membuat rahasia untuk Anda Redis Enterprise Cloud konfigurasi

catatan

Topik berikutnya:

Topik sebelumnya:

Perlu bantuan?

Related resources

Apakah halaman ini membantu Anda?

Related resources