Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pencarian vektor untuk Amazon DocumentDB
Pencarian vektor adalah metode yang digunakan dalam pembelajaran mesin untuk menemukan titik data yang serupa dengan titik data tertentu dengan membandingkan representasi vektor mereka menggunakan metrik jarak atau kesamaan. Semakin dekat kedua vektor berada di ruang vektor, semakin mirip item yang mendasarinya. Teknik ini membantu menangkap makna semantik data. Pendekatan ini berguna dalam berbagai aplikasi, seperti sistem rekomendasi, pemrosesan bahasa alami, dan pengenalan gambar.
Pencarian vektor untuk Amazon DocumentDB menggabungkan fleksibilitas dan kemampuan query yang kaya dari database dokumen berbasis JSON dengan kekuatan pencarian vektor. Jika Anda ingin menggunakan data Amazon DocumentDB yang ada atau struktur data dokumen yang fleksibel untuk membangun pembelajaran mesin dan kasus penggunaan AI generatif, seperti pengalaman pencarian semantik, rekomendasi produk, personalisasi, chatbots, deteksi penipuan, dan deteksi anomali, maka pencarian vektor untuk Amazon DocumentDB adalah pilihan ideal untuk Anda. Pencarian vektor tersedia di cluster berbasis instans Amazon DocumentDB 5.0.
Topik
Memasukkan vektor
Untuk menyisipkan vektor ke dalam database Amazon DocumentDB, Anda dapat menggunakan metode penyisipan yang ada:
Contoh
Dalam contoh berikut, kumpulan lima dokumen dalam database pengujian dibuat. Setiap dokumen mencakup dua bidang: nama produk dan penyematan vektor yang sesuai.
db.collection.insertMany([ {"product_name": "Product A", "vectorEmbedding": [0.2, 0.5, 0.8]}, {"product_name": "Product B", "vectorEmbedding": [0.7, 0.3, 0.9]}, {"product_name": "Product C", "vectorEmbedding": [0.1, 0.2, 0.5]}, {"product_name": "Product D", "vectorEmbedding": [0.9, 0.6, 0.4]}, {"product_name": "Product E", "vectorEmbedding": [0.4, 0.7, 0.2]} ]);
Membuat indeks vektor
Amazon DocumentDB mendukung pengindeksan Hierarchical Navigable Small World HNSW () dan Inverted File dengan metode pengindeksan Flat Compression (). IVFFlat IVFFlatIndeks memisahkan vektor ke dalam daftar dan selanjutnya mencari subset terpilih dari daftar yang terdekat dengan vektor kueri. Di sisi lain, HNSW indeks mengatur data vektor ke dalam grafik berlapis-lapis. Meskipun HNSW memiliki waktu pembuatan yang lebih lambat dibandingkan denganIVFFlat, ini memberikan kinerja kueri dan penarikan yang lebih baik. Tidak sepertiIVFFlat, tidak HNSW ada langkah pelatihan yang terlibat, memungkinkan indeks dihasilkan tanpa beban data awal. Untuk sebagian besar kasus penggunaan, sebaiknya gunakan tipe HNSW indeks untuk pencarian vektor.
Jika Anda tidak membuat indeks vektor, Amazon DocumentDB melakukan pencarian tetangga terdekat yang tepat, memastikan penarikan yang sempurna. Namun, dalam skenario produksi, kecepatan sangat penting. Kami merekomendasikan penggunaan indeks vektor, yang dapat memperdagangkan beberapa penarikan untuk meningkatkan kecepatan. Penting untuk dicatat bahwa menambahkan indeks vektor dapat menyebabkan hasil kueri yang berbeda.
Template
Anda dapat menggunakan runCommand
templat createIndex
atau templat berikut untuk membuat indeks vektor pada bidang vektor:
Parameter | Persyaratan | Tipe data | Deskripsi | Nilai |
---|---|---|---|---|
|
opsional |
string |
Menentukan nama indeks. |
Alfanumerik |
|
opsional |
Menentukan jenis indeks. |
Didukung: hnsw atau ivfflat Default: HNSW (patch mesin 3.0.4574 dan seterusnya) |
|
|
wajib |
integer |
Menentukan jumlah dimensi dalam data vektor. |
Maksimal 2.000 dimensi. |
|
wajib |
string |
Menentukan metrik jarak yang digunakan untuk perhitungan kesamaan. |
|
|
diperlukan untuk IVFFlat |
integer |
Menentukan jumlah cluster yang IVFFlat indeks menggunakan untuk mengelompokkan data vektor. Pengaturan yang disarankan adalah # dokumen/1000 untuk hingga 1 juta dokumen dan |
Minimal: 1 Maksimum: Lihat daftar per tipe contoh tabel di Fitur dan keterbatasan bawah ini. |
|
opsional |
integer |
Menentukan jumlah max koneksi untuk indeks HNSW |
Default: 16 Rentang [2, 100] |
|
opsional |
integer |
Menentukan ukuran daftar kandidat dinamis untuk membangun grafik untuk HNSW indeks.
|
Default: 64 Rentang [4, 1000] |
Penting bagi Anda untuk menetapkan nilai sub-parameter seperti lists
untuk IVFFlat dan m
dan efConstruction
untuk HNSW dengan tepat karena akan memengaruhi akurasi/penarikan, waktu pembuatan, dan kinerja pencarian Anda. Nilai daftar yang lebih tinggi meningkatkan kecepatan kueri karena mengurangi jumlah vektor di setiap daftar, menghasilkan wilayah yang lebih kecil. Namun, ukuran wilayah yang lebih kecil dapat menyebabkan lebih banyak kesalahan penarikan, menghasilkan akurasi yang lebih rendah. UntukHNSW, meningkatkan nilai m
dan efConstruction
meningkatkan akurasi, tetapi juga meningkatkan waktu dan ukuran pembuatan indeks. Lihat contoh berikut:
Contoh
Mendapatkan definisi indeks
Anda dapat melihat detail indeks Anda, termasuk indeks vektor, menggunakan perintah: getIndexes
Contoh
db.collection.getIndexes()
Contoh keluaran
[
{
"v" : 4,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test.collection"
},
{
"v" : 4,
"key" : {
"vectorEmbedding" : "vector"
},
"name" : "myIndex",
"vectorOptions" : {
"type" : "ivfflat",
"dimensions" : 3,
"similarity" : "euclidean",
"lists" : 1
},
"ns" : "test.collection"
}
]
Menanyakan vektor
Templat kueri vektor
Gunakan template berikut untuk menanyakan vektor:
db.collection.aggregate([ { $search: { "vectorSearch": { "vector": <query vector>, "path": "<vectorField>", "similarity": "<distance metric>", "k": <number of results>, "probes":<number of probes> [applicable for IVFFlat], "efSearch":<size of the dynamic list during search> [applicable for HNSW] } } } ]);
Parameter | Persyaratan | Tipe | Deskripsi | Nilai |
---|---|---|---|---|
|
wajib |
operator |
Digunakan di dalam perintah $search untuk query vektor. |
|
|
wajib |
array |
Menunjukkan vektor kueri yang akan digunakan untuk menemukan vektor serupa. |
|
|
wajib |
string |
Mendefinisikan nama bidang vektor. |
|
|
wajib |
integer |
Menentukan jumlah hasil yang pencarian kembali. |
|
|
wajib |
string |
Menentukan metrik jarak yang digunakan untuk perhitungan kesamaan. |
|
|
opsional |
integer |
Jumlah cluster yang Anda inginkan pencarian vektor untuk diperiksa. Nilai yang lebih tinggi memberikan penarikan yang lebih baik dengan mengorbankan kecepatan. Ini dapat diatur ke jumlah daftar untuk pencarian tetangga terdekat yang tepat (di mana perencana tidak akan menggunakan indeks). Pengaturan yang disarankan untuk memulai fine-tuning adalah. |
Default: 1 |
|
opsional |
integer |
Menentukan ukuran daftar kandidat dinamis yang digunakan HNSW indeks selama pencarian. Nilai yang lebih tinggi |
Default: 40 Rentang [1, 1000] |
Penting untuk menyempurnakan nilai efSearch
(HNSW) atau probes
(IVFlat) untuk mencapai kinerja dan akurasi yang Anda inginkan. Lihat contoh operasi berikut:
Contoh keluaran
Keluaran dari operasi ini terlihat seperti berikut ini:
{ "_id" : ObjectId("653d835ff96bee02cad7323c"), "product_name" : "Product A", "vectorEmbedding" : [ 0.2, 0.5, 0.8 ] }
{ "_id" : ObjectId("653d835ff96bee02cad7323e"), "product_name" : "Product C", "vectorEmbedding" : [ 0.1, 0.2, 0.5 ] }
Fitur dan keterbatasan
Kompatibilitas versi
Pencarian vektor untuk Amazon DocumentDB hanya tersedia di cluster berbasis instans Amazon DocumentDB 5.0.
vektor
Amazon DocumentDB dapat mengindeks vektor hingga 2.000 dimensi. Namun, hingga 16.000 dimensi dapat disimpan tanpa indeks.
Indeks
-
Untuk pembuatan IVFFlat indeks, pengaturan yang disarankan untuk parameter daftar adalah jumlah dokumen/1000 hingga 1 juta dokumen dan
sqrt(# of documents)
untuk lebih dari 1 juta dokumen. Karena batas memori yang berfungsi, Amazon DocumentDB mendukung nilai maksimum tertentu dari parameter daftar tergantung pada jumlah dimensi. Untuk referensi Anda, tabel berikut memberikan nilai maksimum parameter daftar untuk vektor 500, 1000, dan 2.000 dimensi:Jenis instans Daftar dengan 500 dimensi Daftar dengan 1000 dimensi Daftar dengan 2000 dimensi t3.med
372
257
150
r5.l
915
741
511
r5.xl
1,393
1,196
901
r5.2xl
5,460
5,230
4,788
r5.4xl
7,842
7,599
7,138
r5.8xl
11.220
10.974
10.498
r5.12xl
13,774
13,526
13,044
r5.16xl
15,943
15,694
15,208
r5.24xl
19,585
19,335
18,845
Tidak ada opsi indeks lain seperti
compound
,sparse
ataupartial
didukung dengan indeks vektor.Build indeks paralel tidak didukung untuk HNSW indeks. Ini hanya didukung untuk IVFFlat indeks.
kueri vektor
Untuk kueri pencarian vektor, penting untuk menyempurnakan parameter seperti
probes
atauefSearch
untuk hasil yang optimal. Semakin tinggi nilaiprobes
atauefSearch
parameter, semakin tinggi recall dan semakin rendah kecepatannya. Pengaturan yang disarankan untuk mulai menyempurnakan parameter probe adalah.sqrt(# of lists)
Praktik terbaik
Pelajari praktik terbaik untuk bekerja dengan pencarian vektor di Amazon DocumentDB. Bagian ini terus diperbarui saat praktik terbaik baru diidentifikasi.
-
File Terbalik dengan Pembuatan indeks Flat Compression (IVFFlat) melibatkan pengelompokan dan pengorganisasian titik data berdasarkan kesamaan. Oleh karena itu, agar indeks menjadi lebih efektif, kami menyarankan Anda setidaknya memuat beberapa data sebelum membuat indeks.
-
Untuk kueri pencarian vektor, penting untuk menyempurnakan parameter seperti
probes
atauefSearch
untuk hasil yang optimal. Semakin tinggi nilaiefSearch
parameterprobes
atau, semakin tinggi recall dan semakin rendah kecepatannya. Pengaturan yang disarankan untuk memulai fine tuningprobes
parameter adalahsqrt(lists)
.
Sumber Daya