Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Options de base de données vectorielles
AWS propose une gamme variée de solutions de bases de données vectorielles pour répondre à différents cas d'utilisation et exigences dans les applications d'IA générative. Ces options peuvent être classées globalement en services de base de données individuels et en offres de services gérés, chacune présentant des caractéristiques et des avantages distincts. Comprendre ces options est essentiel pour les entreprises qui cherchent à mettre en œuvre efficacement des fonctionnalités de recherche vectorielle tout en maintenant des performances, une évolutivité et une rentabilité optimales.
Pour plus d'informations sur les solutions de base de données vectorielles, consultez les sections suivantes :
Options de base de données vectorielles individuelles
Les options de base de données vectorielles individuelles disponibles AWS incluent Amazon Kendra, Amazon OpenSearch Service et Amazon RDS for PostgreSQL avec pgvector. (Une extension open source, pgvector ajoute la possibilité de stocker et de rechercher des intégrations vectorielles générées par le machine learning (ML).) Ces solutions proposent différentes approches de la recherche vectorielle, permettant aux entreprises de choisir en fonction de leur infrastructure existante, de leurs exigences techniques et de leurs cas d'utilisation spécifiques.
Amazon Kendra
Amazon Kendra est un service de recherche intelligent destiné aux entreprises qui utilise le traitement du langage naturel et des algorithmes d'apprentissage automatique avancés pour renvoyer des réponses spécifiques aux questions de recherche à partir de vos données. Amazon Kendra simplifie la mise en œuvre de la fonctionnalité de recherche, ce qui en fait une solution backend efficace pour les applications d'IA générative.
Les autres fonctionnalités clés d'Amazon Kendra sont les suivantes :
-
Connexions natives à plus de 40 sources de données
-
Fonctionnalités intégrées de préparation des données
-
Configuration rapide ne nécessitant pas d'expertise technique approfondie
Les avantages d'Amazon Kendra sont les suivants :
-
Traitement automatisé des données (découpage, ingestion, extraction)
-
De puissantes options de personnalisation :
-
Accès programmatique simple via le AWS SDK pour Python (Boto3)
Pour plus d'informations, consultez la section Avantages d'Amazon Kendra dans le guide du développeur Amazon Kendra.
Amazon OpenSearch Service
Amazon OpenSearch Service est un service géré qui vous aide à déployer, exploiter et dimensionner des clusters OpenSearch de services dans le AWS Cloud.
Les principales fonctionnalités du OpenSearch Service sont les suivantes :
-
Moteur de recherche et d'analyse open source
-
Architecture distribuée
-
Traitement des données en temps réel
Certains avantages de l'utilisation du OpenSearch Service sont les suivants :
-
Scalabilité horizontale
-
RESTful Support de l'API
-
Gère les données structurées et non structurées
-
Analyse des données en temps réel
-
Adapté à différentes tailles de déploiement
Pour plus d'informations, consultez la section Fonctionnalités d'Amazon OpenSearch Service dans le Guide du développeur de OpenSearch services.
Amazon RDS pour PostgreSQL avec pgvector
Amazon RDS pour PostgreSQL avec pgvector
Principaux avantages d'Amazon RDS pour PostgreSQL avec pgvector comprennent notamment :
-
Haute disponibilité
-
Basculement automatique
-
Rentable (pay-per-use)
-
Surveillance intégrée
-
Intégration de données vectorielles en temps réel
Pour plus d'informations, consultez les avantages d'Amazon RDS dans le guide de l'utilisateur d'Amazon Relational Database Service.
Option de service géré
Amazon Bedrock Knowledge Bases représente l'approche AWS entièrement gérée de la mise en œuvre de bases de données vectorielles. La flexibilité des options de stockage du service, combinée à ses fonctionnalités de gestion automatisée, le rend particulièrement utile pour les entreprises qui cherchent à mettre en œuvre le RAG sans gérer une infrastructure complexe.
Avec les bases de connaissances Amazon Bedrock, vous pouvez créer, gérer et consulter des bases de connaissances qui améliorent vos modèles de base à l'aide de RAG. Ce service simplifie le processus complexe de mise en œuvre de RAG en gérant l'intégralité du pipeline d'ingestion, de vectorisation et de récupération des données.
Les principaux avantages des bases de connaissances Amazon Bedrock sont les suivants :
Traitement des données simplifié
-
Ingestion et segmentation automatiques des données
-
Extraction de texte intégrée à partir de plusieurs formats de fichiers
-
Génération d'intégrations vectorielles gérées
-
Extraction et indexation automatiques des métadonnées
Implémentation rationalisée du RAG
-
Stratégies de récupération préconfigurées
-
Optimisation automatique des fenêtres contextuelles
-
Réglage de la pertinence intégré
-
Fonctionnalités de recherche sémantique prêtes à l'emploi
Sécurité et gouvernance
-
Contrôles intégrés AWS Identity and Access Management (IAM)
-
Chiffrement des données au repos et en transit
-
Prise en charge de VPC
-
Journalisation des audits avec AWS CloudTrail
Les bases de connaissances Amazon Bedrock prennent en charge plusieurs options de boutiques vectorielles. La liste suivante donne un aperçu des principales fonctionnalités de chaque option :
-
Amazon Aurora PostgreSQL avec pgvector
-
Stockage vectoriel compatible avec PostgreSQL
-
Intégré aux bases de données Aurora existantes
-
Rentable pour les petits déploiements
-
Idéal pour les données hybrides structurées et non structurées
-
-
Amazon Neptune Analytics
-
Recherche vectorielle basée sur des graphiques
-
Combine des données relationnelles avec des vecteurs
-
Idéal pour les cas d'utilisation des données connectées
-
Fonctionnalités de requête avancées
-
-
Amazon OpenSearch sans serveur
-
Expérience sans serveur entièrement gérée
-
Dimensionnement automatique en fonction de la charge de travail
-
Fonctionnalités K-nn intégrées
-
Rentable pour différentes charges de travail
-
-
Pinecone
-
Base de données vectorielle spécialement conçue
-
Des performances élevées à grande échelle
-
Fonctionnalités avancées de recherche de similarité
-
Géré via la console Amazon Bedrock
-
-
Redis Cloud d'entreprise
-
Capacités de recherche vectorielle en mémoire
-
Performances à faible latence
-
Recherche vectorielle en temps réel
-
Fonctionnalités de mise en cache intégrées
-
Lorsque vous choisissez une boutique vectorielle compatible avec les bases de connaissances Amazon Bedrock, tenez compte des principales caractéristiques suivantes de chaque option :
-
Aurora PostgreSQL : données relationnelles dotées de fonctionnalités vectorielles
-
Neptune Analytics — Représentations des connaissances basées sur des graphes
-
OpenSearch Service — Concentration sur la recherche et l'analyse
-
Pinecone — Performances de recherche vectorielle pures
-
Redis Cloud d'entreprise : besoins en temps réel et à faible latence
Chaque implémentation offre les avantages uniques suivants :
-
Aurora PostgreSQL : idéal pour les applications nécessitant à la fois des fonctionnalités SQL traditionnelles et vectorielles
-
Neptune Analytics : idéal pour les requêtes complexes basées sur les relations et les graphes de connaissances
-
OpenSearch Service — Solide en matière de recherche et d'analyse en texte intégral
-
Pinecone — Optimisé pour les opérations vectorielles pures
-
Redis Cloud d'entreprise : idéal pour les applications en temps réel
Voici quelques points clés à prendre en compte lors de la sélection d'un magasin vectoriel pour votre solution RAG :
-
Évolutivité : capacité à gérer efficacement des ensembles de données volumineux et croissants.
-
Performances des requêtes — Fonctionnalités de recherche rapides et efficaces du plus proche voisin.
-
Ingestion de données — Exigences relatives aux modèles de données existants. Support de divers formats de données et facilité d'ingestion.
-
Filtrage et classement — Mécanismes avancés de filtrage et de classement pour les résultats récupérés.
-
Intégration — Intégration parfaite avec d'autres systèmes et outils via APIs nos protocoles.
-
Persistance et durabilité — Options de persistance et de durabilité appropriées (en mémoire ou sur disque).
-
Concurrence et cohérence — Gestion efficace de l'accès simultané et de la cohérence des données.
-
Licences et coûts — Évaluation du modèle de licence, des coûts initiaux et permanents, et de la dépendance vis-à-vis des fournisseurs.
-
Communauté et support — Communauté dynamique et documentation complète.
-
Sécurité et conformité — Respect des exigences de sécurité et de conformité nécessaires.