Meilleures pratiques en matière de vecteurs S3 - Amazon Simple Storage Service

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Meilleures pratiques en matière de vecteurs S3

Amazon S3 Vectors fournit un stockage vectoriel spécialement conçu et optimisé en termes de coûts, destiné aux applications basées sur l'IA et à la recherche sémantique de votre contenu stocké dans Amazon S3. Conçu pour fournir une élasticité et une durabilité de niveau S3 pour le stockage d'ensembles de données vectorielles avec des performances de requête inférieures à la seconde, S3 Vectors est idéal pour les applications qui doivent créer et développer des index vectoriels. Avec S3 Vectors, vous pouvez utiliser un ensemble dédié d'opérations d'API pour stocker, accéder et exécuter des requêtes de similarité sur des données vectorielles sans fournir d'infrastructure. Pour de plus amples informations, veuillez consulter Utilisation de vecteurs S3 et de buckets vectoriels.

Pour tirer le meilleur parti des vecteurs S3, nous vous recommandons de suivre les meilleures pratiques suivantes.

Insertion et suppression de vecteurs

Votre application peut atteindre au moins cinq DeleteVectorsrequêtes par seconde PutVectorset par index vectoriel. Si vous dépassez le taux de demandes, il est possible que vous receviez un 429 TooManyRequestsException message d'erreur. Pour optimiser le débit des demandes et optimiser la vitesse et l'efficacité, nous vous recommandons d'insérer et de supprimer des vecteurs par lots importants, jusqu'à un maximum de 500 vecteurs par demande d'API. Pour de plus amples informations, veuillez consulter Indices vectoriels.

Accès et interrogation de vecteurs dans un index vectoriel S3

Votre application peut traiter des centaines de QueryVectorsListVectorsrequêtes par seconde par index vectoriel S3. GetVectors Si vous dépassez le taux de demandes, il est possible que vous receviez un 429 TooManyRequestsException message d'erreur. Nous vous recommandons d'utiliser un mécanisme de nouvelle tentative et de configurer votre application pour qu'elle envoie moins de demandes.

Mise à l'échelle des index vectoriels

Pour améliorer les performances des requêtes par index vectoriel, pensez à configurer votre application pour diviser les vecteurs sur plusieurs index vectoriels lorsque cela est possible. Par exemple, si vous avez des charges de travail multi-locataires et que votre application interroge chaque locataire indépendamment, envisagez de stocker les vecteurs de chaque locataire dans un index vectoriel distinct. Pour de plus amples informations, veuillez consulter Indices vectoriels.

Implémentation de la mutualisation avec des index vectoriels distincts

Vous pouvez obtenir la mutualisation en organisant vos données vectorielles à l'aide d'un index vectoriel unique pour chaque locataire. Vous pouvez utiliser les politiques IAM et de bucket pour restreindre l'accès de chaque locataire uniquement à son index vectoriel désigné. Cette approche permet de préserver l'isolation des données et de simplifier la gestion en éliminant la nécessité de créer des compartiments distincts pour chaque locataire. Pour de plus amples informations, veuillez consulter Gestion des identités et des accès dans S3 Vectors.

Configuration de champs de métadonnées non filtrables pour les index vectoriels

Lorsque vous créez un index vectoriel, configurez les champs de métadonnées qui ne nécessitent pas de filtrage en tant que clés de métadonnées non filtrables. Par exemple, stockez des fragments de texte pour les intégrations vectorielles sous forme de champs de métadonnées non filtrables lorsque vous en avez besoin uniquement à titre de référence. Pour de plus amples informations, veuillez consulter Métadonnées non filtrables.