Indeks vektor - Amazon Simple Storage Service

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Indeks vektor

catatan

Vektor Amazon S3 sedang dalam rilis pratinjau untuk Amazon Simple Storage Service dan dapat berubah sewaktu-waktu.

catatan

Pilih parameter konfigurasi indeks vektor Anda dengan hati-hati. Setelah membuat indeks vektor, Anda tidak dapat memperbarui nama indeks vektor, dimensi, metrik jarak, atau kunci metadata yang tidak dapat difilter. Untuk mengubah salah satu dari nilai-nilai ini, Anda harus membuat indeks vektor baru.

Indeks vektor adalah sumber daya dalam bucket vektor yang menyimpan dan mengatur data vektor untuk operasi pencarian kesamaan yang efisien. Saat Anda membuat indeks vektor, Anda menentukan metrik jarak (CosineatauEuclidean), jumlah dimensi yang harus dimiliki vektor, dan secara opsional daftar bidang metadata yang ingin Anda kecualikan dari pemfilteran selama kueri kesamaan.

Untuk informasi selengkapnya tentang batas indeks vektor per ember, batas vektor per indeks, dan batas dimensi per vektor, lihatKeterbatasan dan pembatasan.

Setiap indeks vektor memiliki Nama Sumber Daya Amazon (ARN) yang unik. Indeks vektor mengikuti format berikut: ARNs

arn:aws:s3vectors:region:account-id:bucket/bucket-name/index/index-name

Persyaratan penamaan indeks vektor

  • Nama indeks vektor harus unik dalam ember vektor.

  • Nama indeks vektor harus antara 3 dan 63 karakter.

  • Karakter yang valid adalah huruf kecil (a-z), angka (0-9), tanda hubung (-), dan titik (.).

  • Nama indeks vektor harus dimulai dan diakhiri dengan huruf atau angka.

Persyaratan dimensi

Dimensi adalah jumlah nilai dalam vektor. Semua vektor yang ditambahkan ke indeks harus memiliki jumlah nilai yang tepat ini.

  • Dimensi harus berupa bilangan bulat antara 1 dan 4096.

  • Dimensi yang lebih besar membutuhkan lebih banyak ruang penyimpanan.

Opsi metrik jarak

Metrik jarak menentukan bagaimana kesamaan antara vektor dihitung. Saat membuat penyematan vektor, pilih metrik jarak yang direkomendasikan model penyematan Anda untuk hasil yang lebih akurat.

  • Cosinus — Mengukur kosinus sudut antar vektor. Terbaik untuk vektor yang dinormalisasi dan ketika arah lebih penting daripada besarnya.

  • Euclidean — Mengukur jarak garis lurus antara vektor. Terbaik ketika arah dan besarnya penting.

Tombol metadata yang tidak dapat disaring

Tombol metadata memungkinkan Anda untuk melampirkan informasi tambahan ke vektor Anda sebagai pasangan nilai kunci selama penyimpanan dan pengambilan. Secara default, semua metadata dapat difilter, sehingga Anda dapat menggunakannya untuk memfilter hasil kueri. Namun, Anda dapat menetapkan kunci metadata tertentu sebagai tidak dapat difilter saat Anda ingin menyimpan informasi dengan vektor tanpa menggunakannya untuk pemfilteran.

Tidak seperti kunci metadata default, kunci ini tidak dapat digunakan sebagai filter kueri. Kunci metadata yang tidak dapat difilter dapat diambil tetapi tidak dapat dicari, ditanyakan, atau difilter. Anda hanya dapat mengaksesnya setelah menemukan indeks.

Tombol metadata yang tidak dapat difilter memungkinkan Anda untuk memperkaya vektor dengan konteks tambahan yang ingin Anda ambil dengan hasil pencarian tetapi tidak perlu untuk pemfilteran. Contoh umum dari kunci metadata yang tidak dapat difilter adalah ketika Anda menyematkan teks ke dalam vektor dan ingin menyertakan teks asli itu sendiri sebagai metadata yang tidak dapat difilter. Ini memungkinkan Anda mengembalikan teks sumber bersama hasil pencarian vektor tanpa meningkatkan batas ukuran metadata yang dapat difilter. Contoh lain termasuk menyimpan stempel waktu pembuatan, sumber URLs, atau informasi deskriptif murni untuk referensi. Kunci metadata yang tidak dapat difilter dapat diakses saat mengambil vektor tetapi, tidak seperti kunci metadata default, kunci ini tidak dapat digunakan sebagai filter kueri.

Persyaratan untuk kunci metadata yang tidak dapat difilter adalah sebagai berikut.

  • Kunci metadata yang tidak dapat difilter harus unik dalam indeks vektor.

  • Tombol metadata yang tidak dapat difilter harus memiliki panjang 1 hingga 63 karakter.

  • Kunci metadata yang tidak dapat difilter tidak dapat dimodifikasi setelah indeks vektor dibuat.

  • Vektor S3 mendukung hingga 10 kunci metadata yang tidak dapat difilter per indeks.