Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Praktik terbaik Vektor S3
Vektor Amazon S3 menghadirkan penyimpanan vektor yang dibuat khusus dan dioptimalkan biaya untuk digunakan oleh aplikasi berkemampuan AI dan pencarian semantik konten Anda yang disimpan di Amazon S3. Dirancang untuk memberikan elastisitas dan daya tahan tingkat S3 untuk menyimpan kumpulan data vektor dengan kinerja kueri sub-detik, Vektor S3 sangat ideal untuk aplikasi yang perlu membangun dan menumbuhkan indeks vektor. Dengan Vektor S3, Anda dapat menggunakan serangkaian operasi API khusus untuk menyimpan, mengakses, dan melakukan kueri kesamaan pada data vektor tanpa menyediakan infrastruktur apa pun. Untuk informasi selengkapnya, lihat Bekerja dengan Vektor S3 dan ember vektor.
Untuk memastikan manfaat maksimal dari Vektor S3, kami sarankan Anda melakukan praktik terbaik berikut.
- Memasukkan dan menghapus vektor
-
Aplikasi Anda dapat mencapai setidaknya lima PutVectorsdan DeleteVectorspermintaan per detik per indeks vektor. Jika Anda melebihi tarif permintaan, Anda mungkin menerima
429 TooManyRequestsException
kesalahan. Untuk memaksimalkan throughput permintaan dan mengoptimalkan kecepatan dan efisiensi, sebaiknya Anda memasukkan dan menghapus vektor dalam batch besar, hingga maksimum 500 vektor per permintaan API. Untuk informasi selengkapnya, lihat Indeks vektor. - Mengakses dan menanyakan vektor dalam indeks vektor S3
-
Aplikasi Anda dapat mencapai ratusan QueryVectors, GetVectors, atau ListVectorspermintaan per detik per indeks vektor S3. Jika Anda melebihi tarif permintaan, Anda mungkin menerima
429 TooManyRequestsException
kesalahan. Kami menyarankan Anda menggunakan mekanisme coba lagi dan konfigurasikan aplikasi Anda untuk mengirim lebih sedikit permintaan. - Penskalaan di seluruh indeks vektor
-
Untuk meningkatkan kinerja kueri per indeks vektor, pertimbangkan untuk mengonfigurasi aplikasi Anda untuk membagi vektor di beberapa indeks vektor bila memungkinkan. Misalnya, jika Anda memiliki beban kerja multi-tenant dan aplikasi Anda menanyakan setiap penyewa secara independen, pertimbangkan untuk menyimpan vektor setiap penyewa dalam indeks vektor terpisah. Untuk informasi selengkapnya, lihat Indeks vektor.
- Menerapkan multi-tenancy dengan indeks vektor terpisah
-
Anda dapat mencapai multi-tenancy dengan mengatur data vektor Anda menggunakan indeks vektor tunggal untuk setiap penyewa. Anda dapat menggunakan kebijakan IAM dan bucket untuk membatasi akses setiap penyewa hanya ke indeks vektor yang ditentukan. Pendekatan ini membantu menjaga isolasi data dan menyederhanakan manajemen dengan menghilangkan kebutuhan untuk membuat bucket terpisah untuk setiap penyewa. Untuk informasi selengkapnya, lihat Manajemen Identitas dan Akses di Vektor S3.
- Mengkonfigurasi bidang metadata yang tidak dapat difilter untuk indeks vektor
-
Saat membuat indeks vektor, konfigurasikan bidang metadata yang tidak memerlukan pemfilteran sebagai kunci metadata yang tidak dapat difilter. Misalnya, simpan potongan teks untuk penyematan vektor sebagai bidang metadata yang tidak dapat difilter saat Anda membutuhkannya hanya untuk referensi. Lihat informasi yang lebih lengkap di Metadata yang tidak dapat disaring.