Meilleures pratiques en matière de vecteurs S3

Amazon S3 Vectors fournit un stockage vectoriel spécialement conçu et optimisé en termes de coûts, destiné aux applications basées sur l'IA et à la recherche sémantique de votre contenu stocké dans Amazon S3. Conçu pour fournir une élasticité et une durabilité de niveau S3 pour le stockage d'ensembles de données vectorielles avec des performances de requête inférieures à la seconde, S3 Vectors est idéal pour les applications qui doivent créer et développer des index vectoriels. Avec S3 Vectors, vous pouvez utiliser un ensemble dédié d'opérations d'API pour stocker, accéder et exécuter des requêtes de similarité sur des données vectorielles sans fournir d'infrastructure. Pour de plus amples informations, veuillez consulter Utilisation de vecteurs S3 et de buckets vectoriels.

Pour tirer le meilleur parti des vecteurs S3, nous vous recommandons de suivre les meilleures pratiques suivantes.

Insertion et suppression de vecteurs: Votre application peut atteindre au moins cinq DeleteVectorsrequêtes par seconde PutVectorset par index vectoriel. Si vous dépassez le taux de demandes, il est possible que vous receviez un 429 TooManyRequestsException message d'erreur. Pour optimiser le débit des demandes et optimiser la vitesse et l'efficacité, nous vous recommandons d'insérer et de supprimer des vecteurs par lots importants, jusqu'à un maximum de 500 vecteurs par demande d'API. Pour de plus amples informations, veuillez consulter Indices vectoriels.
Accès et interrogation de vecteurs dans un index vectoriel S3: Votre application peut traiter des centaines de QueryVectors ListVectorsrequêtes par seconde par index vectoriel S3. GetVectors Si vous dépassez le taux de demandes, il est possible que vous receviez un 429 TooManyRequestsException message d'erreur. Nous vous recommandons d'utiliser un mécanisme de nouvelle tentative et de configurer votre application pour qu'elle envoie moins de demandes.
Mise à l'échelle des index vectoriels: Pour améliorer les performances des requêtes par index vectoriel, pensez à configurer votre application pour diviser les vecteurs sur plusieurs index vectoriels lorsque cela est possible. Par exemple, si vous avez des charges de travail multi-locataires et que votre application interroge chaque locataire indépendamment, envisagez de stocker les vecteurs de chaque locataire dans un index vectoriel distinct. Pour de plus amples informations, veuillez consulter Indices vectoriels.
Implémentation de la mutualisation avec des index vectoriels distincts: Vous pouvez obtenir la mutualisation en organisant vos données vectorielles à l'aide d'un index vectoriel unique pour chaque locataire. Vous pouvez utiliser les politiques IAM et de bucket pour restreindre l'accès de chaque locataire uniquement à son index vectoriel désigné. Cette approche permet de préserver l'isolation des données et de simplifier la gestion en éliminant la nécessité de créer des compartiments distincts pour chaque locataire. Pour de plus amples informations, veuillez consulter Gestion des identités et des accès dans S3 Vectors.
Configuration de champs de métadonnées non filtrables pour les index vectoriels: Lorsque vous créez un index vectoriel, configurez les champs de métadonnées qui ne nécessitent pas de filtrage en tant que clés de métadonnées non filtrables. Par exemple, stockez des fragments de texte pour les intégrations vectorielles sous forme de champs de métadonnées non filtrables lorsque vous en avez besoin uniquement à titre de référence. Pour de plus amples informations, veuillez consulter Métadonnées non filtrables.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Limites et restrictions

Création et recherche d'intégrations vectorielles avec s3vectors-embed-cli