Options de base de données vectorielles individuelles Option de service géré

Options de base de données vectorielles

AWS propose une gamme variée de solutions de bases de données vectorielles pour répondre à différents cas d'utilisation et exigences dans les applications d'IA générative. Ces options peuvent être classées globalement en services de base de données individuels et en offres de services gérés, chacune présentant des caractéristiques et des avantages distincts. Comprendre ces options est essentiel pour les entreprises qui cherchent à mettre en œuvre efficacement des fonctionnalités de recherche vectorielle tout en maintenant des performances, une évolutivité et une rentabilité optimales.

Pour plus d'informations sur les solutions de base de données vectorielles, consultez les sections suivantes :

Options de base de données vectorielles individuelles
Option de service géré

Options de base de données vectorielles individuelles

Les options de base de données vectorielles individuelles disponibles AWS incluent Amazon Kendra, Amazon OpenSearch Service et Amazon RDS for PostgreSQL avec pgvector. (Une extension open source, pgvector ajoute la possibilité de stocker et de rechercher des intégrations vectorielles générées par le machine learning (ML).) Ces solutions proposent différentes approches de la recherche vectorielle, permettant aux entreprises de choisir en fonction de leur infrastructure existante, de leurs exigences techniques et de leurs cas d'utilisation spécifiques.

Amazon Kendra

Amazon Kendra est un service de recherche intelligent destiné aux entreprises qui utilise le traitement du langage naturel et des algorithmes d'apprentissage automatique avancés pour renvoyer des réponses spécifiques aux questions de recherche à partir de vos données. Amazon Kendra simplifie la mise en œuvre de la fonctionnalité de recherche, ce qui en fait une solution backend efficace pour les applications d'IA générative.

Les autres fonctionnalités clés d'Amazon Kendra sont les suivantes :

Connexions natives à plus de 40 sources de données
Fonctionnalités intégrées de préparation des données
Configuration rapide ne nécessitant pas d'expertise technique approfondie

Les avantages d'Amazon Kendra sont les suivants :

Traitement automatisé des données (découpage, ingestion, extraction)
De puissantes options de personnalisation :
Accès programmatique simple via le AWS SDK pour Python (Boto3)

Pour plus d'informations, consultez la section Avantages d'Amazon Kendra dans le guide du développeur Amazon Kendra.

Amazon OpenSearch Service

Amazon OpenSearch Service est un service géré qui vous aide à déployer, exploiter et dimensionner des clusters OpenSearch de services dans le AWS Cloud.

Les principales fonctionnalités du OpenSearch Service sont les suivantes :

Moteur de recherche et d'analyse open source
Architecture distribuée
Traitement des données en temps réel

Certains avantages de l'utilisation du OpenSearch Service sont les suivants :

Scalabilité horizontale
RESTful Support de l'API
Gère les données structurées et non structurées
Analyse des données en temps réel
Adapté à différentes tailles de déploiement

Pour plus d'informations, consultez la section Fonctionnalités d'Amazon OpenSearch Service dans le Guide du développeur de OpenSearch services.

Amazon RDS pour PostgreSQL avec pgvector

Amazon RDS pour PostgreSQL avec pgvectorcombine le service de base de données relationnelle AWS gérée avec l'extension de traitement vectoriel de PostgreSQL. Cette combinaison permet aux entreprises de stocker et d'interroger des vecteurs de grande dimension tout en gérant Amazon RDS. La solution est particulièrement adaptée aux applications d'intelligence artificielle génératives qui nécessitent des opérations vectorielles en temps réel sans la surcharge liée à la gestion de l'infrastructure de base de données.

Principaux avantages d'Amazon RDS pour PostgreSQL avec pgvector comprennent notamment :

Haute disponibilité
Basculement automatique
Rentable (pay-per-use)
Surveillance intégrée
Intégration de données vectorielles en temps réel

Pour plus d'informations, consultez les avantages d'Amazon RDS dans le guide de l'utilisateur d'Amazon Relational Database Service.

Option de service géré

Amazon Bedrock Knowledge Bases représente l'approche AWS entièrement gérée de la mise en œuvre de bases de données vectorielles. La flexibilité des options de stockage du service, combinée à ses fonctionnalités de gestion automatisée, le rend particulièrement utile pour les entreprises qui cherchent à mettre en œuvre le RAG sans gérer une infrastructure complexe.

Avec les bases de connaissances Amazon Bedrock, vous pouvez créer, gérer et consulter des bases de connaissances qui améliorent vos modèles de base à l'aide de RAG. Ce service simplifie le processus complexe de mise en œuvre de RAG en gérant l'intégralité du pipeline d'ingestion, de vectorisation et de récupération des données.

Les principaux avantages des bases de connaissances Amazon Bedrock sont les suivants :

Traitement des données simplifié

Ingestion et segmentation automatiques des données
Extraction de texte intégrée à partir de plusieurs formats de fichiers
Génération d'intégrations vectorielles gérées
Extraction et indexation automatiques des métadonnées

Implémentation rationalisée du RAG

Stratégies de récupération préconfigurées
Optimisation automatique des fenêtres contextuelles
Réglage de la pertinence intégré
Fonctionnalités de recherche sémantique prêtes à l'emploi

Sécurité et gouvernance

Contrôles intégrés AWS Identity and Access Management (IAM)
Chiffrement des données au repos et en transit
Prise en charge de VPC
Journalisation des audits avec AWS CloudTrail

Les bases de connaissances Amazon Bedrock prennent en charge plusieurs options de boutiques vectorielles. La liste suivante donne un aperçu des principales fonctionnalités de chaque option :

Amazon Aurora PostgreSQL avec pgvector
- Stockage vectoriel compatible avec PostgreSQL
- Intégré aux bases de données Aurora existantes
- Rentable pour les petits déploiements
- Idéal pour les données hybrides structurées et non structurées
Amazon Neptune Analytics
- Recherche vectorielle basée sur des graphiques
- Combine des données relationnelles avec des vecteurs
- Idéal pour les cas d'utilisation des données connectées
- Fonctionnalités de requête avancées
Amazon OpenSearch sans serveur
- Expérience sans serveur entièrement gérée
- Dimensionnement automatique en fonction de la charge de travail
- Fonctionnalités K-nn intégrées
- Rentable pour différentes charges de travail
Pinecone
- Base de données vectorielle spécialement conçue
- Des performances élevées à grande échelle
- Fonctionnalités avancées de recherche de similarité
- Géré via la console Amazon Bedrock
Redis Cloud d'entreprise
- Capacités de recherche vectorielle en mémoire
- Performances à faible latence
- Recherche vectorielle en temps réel
- Fonctionnalités de mise en cache intégrées

Lorsque vous choisissez une boutique vectorielle compatible avec les bases de connaissances Amazon Bedrock, tenez compte des principales caractéristiques suivantes de chaque option :

Aurora PostgreSQL : données relationnelles dotées de fonctionnalités vectorielles
Neptune Analytics — Représentations des connaissances basées sur des graphes
OpenSearch Service — Concentration sur la recherche et l'analyse
Pinecone — Performances de recherche vectorielle pures
Redis Cloud d'entreprise : besoins en temps réel et à faible latence

Chaque implémentation offre les avantages uniques suivants :

Aurora PostgreSQL : idéal pour les applications nécessitant à la fois des fonctionnalités SQL traditionnelles et vectorielles
Neptune Analytics : idéal pour les requêtes complexes basées sur les relations et les graphes de connaissances
OpenSearch Service — Solide en matière de recherche et d'analyse en texte intégral
Pinecone — Optimisé pour les opérations vectorielles pures
Redis Cloud d'entreprise : idéal pour les applications en temps réel

Voici quelques points clés à prendre en compte lors de la sélection d'un magasin vectoriel pour votre solution RAG :

Évolutivité : capacité à gérer efficacement des ensembles de données volumineux et croissants.
Performances des requêtes — Fonctionnalités de recherche rapides et efficaces du plus proche voisin.
Ingestion de données — Exigences relatives aux modèles de données existants. Support de divers formats de données et facilité d'ingestion.
Filtrage et classement — Mécanismes avancés de filtrage et de classement pour les résultats récupérés.
Intégration — Intégration parfaite avec d'autres systèmes et outils via APIs nos protocoles.
Persistance et durabilité — Options de persistance et de durabilité appropriées (en mémoire ou sur disque).
Concurrence et cohérence — Gestion efficace de l'accès simultané et de la cohérence des données.
Licences et coûts — Évaluation du modèle de licence, des coûts initiaux et permanents, et de la dépendance vis-à-vis des fournisseurs.
Communauté et support — Communauté dynamique et documentation complète.
Sécurité et conformité — Respect des exigences de sécurité et de conformité nécessaires.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Vue d'ensemble des bases de données vectorielles

Comparaison de bases de données vectorielles