Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Vektor-Datenbankoptionen
AWS bietet eine breite Palette von Vektordatenbanklösungen zur Unterstützung verschiedener Anwendungsfälle und Anforderungen in generativen KI-Anwendungen. Diese Optionen können grob in einzelne Datenbankdienste und Managed-Services-Angebote unterteilt werden, die jeweils unterschiedliche Merkmale und Vorteile aufweisen. Das Verständnis dieser Optionen ist für Unternehmen von entscheidender Bedeutung, die Vektorsuchfunktionen effektiv implementieren und gleichzeitig optimale Leistung, Skalierbarkeit und Kosteneffizienz gewährleisten möchten.
Weitere Informationen zu Vektordatenbanklösungen finden Sie in den folgenden Abschnitten:
Individuelle Vektor-Datenbankoptionen
Zu den einzelnen Vektordatenbankoptionen AWS gehören Amazon Kendra, Amazon OpenSearch Service und Amazon RDS for PostgreSQL mit pgvector. (Eine Open-Source-Erweiterung, pgvector bietet die Möglichkeit, durch maschinelles Lernen (ML) generierte Vektoreinbettungen zu speichern und zu durchsuchen.) Diese Lösungen bieten unterschiedliche Ansätze für die Vektorsuche, sodass Unternehmen ihre Auswahl auf der Grundlage ihrer vorhandenen Infrastruktur, ihrer technischen Anforderungen und spezifischen Anwendungsfälle treffen können.
Amazon Kendra
Amazon Kendra ist ein intelligenter Suchdienst für Unternehmen, der natürliche Sprachverarbeitung und fortschrittliche Algorithmen für maschinelles Lernen verwendet, um spezifische Antworten auf Suchfragen aus Ihren Daten zurückzugeben. Amazon Kendra vereinfacht die Implementierung von Suchfunktionen und ist damit eine effektive Backend-Lösung für generative KI-Anwendungen.
Zu den weiteren wichtigen Funktionen von Amazon Kendra gehören:
-
Native Verbindungen zu über 40 Datenquellen
-
Integrierte Funktionen zur Datenvorbereitung
-
Schnelle Einrichtung, die kein tiefes technisches Fachwissen erfordert
Zu den Vorteilen von Amazon Kendra gehören:
-
Automatisierte Datenverarbeitung (Chunking, Ingestion, Abruf)
-
Leistungsstarke Anpassungsoptionen:
-
Einfacher programmatischer Zugriff über AWS SDK für Python (Boto3)
Weitere Informationen finden Sie unter Vorteile von Amazon Kendra im Amazon Kendra Developer Guide.
OpenSearch Amazon-Dienst
Amazon OpenSearch Service ist ein verwalteter Service, der Sie bei der Bereitstellung, dem Betrieb und der Skalierung von OpenSearch Service-Clustern in der unterstützt AWS Cloud.
Zu den Kernfunktionen von OpenSearch Service gehören:
-
Open-Source-Such- und Analyse-Engine
-
Verteilte Architektur
-
Datenverarbeitung in Echtzeit
Zu den Vorteilen der Nutzung des OpenSearch Dienstes gehören die folgenden:
-
Horizontale Skalierbarkeit
-
RESTful API-Unterstützung
-
Verarbeitet strukturierte und unstrukturierte Daten
-
Datenanalyse in Echtzeit
-
Geeignet für verschiedene Einsatzgrößen
Weitere Informationen finden Sie unter Funktionen von Amazon OpenSearch Service im OpenSearch Service Developer Guide.
Amazon RDS for PostgreSQL mit pgvector
Amazon RDS for PostgreSQL mit pgvector
Hauptvorteile von Amazon RDS for PostgreSQL mit pgvector sind Folgende:
-
Hohe Verfügbarkeit
-
Automatisches Failover
-
Kostengünstig () pay-per-use
-
Integrierte Überwachung
-
Integration von Vektordaten in Echtzeit
Weitere Informationen finden Sie unter Vorteile von Amazon RDS im Amazon Relational Database Service Service-Benutzerhandbuch.
Option für verwalteten Service
Amazon Bedrock Knowledge Bases steht für den AWS vollständig verwalteten Ansatz zur Implementierung von Vektordatenbanken. Die Flexibilität der Speicheroptionen des Service in Kombination mit seinen automatisierten Verwaltungsfunktionen macht ihn besonders für Unternehmen interessant, die RAG implementieren möchten, ohne eine komplexe Infrastruktur verwalten zu müssen.
Mit Amazon Bedrock Knowledge Bases können Sie Wissensdatenbanken erstellen, verwalten und abfragen, die Ihre Basismodelle mithilfe von RAG verbessern. Dieser Service vereinfacht den komplexen Prozess der Implementierung von RAG, indem er die gesamte Pipeline für Datenaufnahme, Vektorisierung und Datenabruf verwaltet.
Zu den wichtigsten Vorteilen von Amazon Bedrock Knowledge Bases gehören:
Vereinfachte Datenverarbeitung
-
Automatische Datenaufnahme und -aufteilung
-
Integrierte Textextraktion aus mehreren Dateiformaten
-
Generierung verwalteter Vektoreinbettungen
-
Automatische Extraktion und Indexierung von Metadaten
Optimierte RAG-Implementierung
-
Vorkonfigurierte Abrufstrategien
-
Automatische Optimierung des Kontextfensters
-
Integrierte Relevanzoptimierung
-
Semantische Suchfunktionen, sofort einsatzbereit
Sicherheit und Governance
-
Integrierte AWS Identity and Access Management (IAM) Steuerungen
-
Datenverschlüsselung im Ruhezustand und bei der Übertragung
-
VPC-Unterstützung
-
Audit-Protokollierung mit AWS CloudTrail
Amazon Bedrock Knowledge Bases unterstützt mehrere Vector Store-Optionen. Die folgende Liste bietet einen Überblick über die wichtigsten Funktionen der einzelnen Optionen:
-
Amazon Aurora PostgreSQL mit pgvector
-
PostgreSQL-kompatibler Vektorspeicher
-
Integriert in bestehende Aurora-Datenbanken
-
Kostengünstig für kleinere Bereitstellungen
-
Gut für hybride strukturierte und unstrukturierte Daten
-
-
Amazon Neptune Analytics
-
Graphbasierte Vektorsuche
-
Kombiniert Beziehungsdaten mit Vektoren
-
Ideal für Anwendungsfälle im Zusammenhang mit vernetzten Daten
-
Erweiterte Abfragefunktionen
-
-
Amazon OpenSearch Serverlos
-
Vollständig verwaltetes serverloses Erlebnis
-
Automatische Skalierung basierend auf der Arbeitslast
-
Integrierte k-NN-Funktionen
-
Kostengünstig für unterschiedliche Workloads
-
-
Pinecone
-
Speziell entwickelte Vektordatenbank
-
Hohe Leistung im großen Maßstab
-
Erweiterte Funktionen zur Ähnlichkeitssuche
-
Verwaltet über die Amazon Bedrock-Konsole
-
-
Redis Cloud für Unternehmen
-
Funktionen für die Vektorsuche im Speicher
-
Leistung mit niedriger Latenz
-
Vektorsuche in Echtzeit
-
Integrierte Caching-Funktionen
-
Bei der Auswahl eines Vector Store, der von Amazon Bedrock Knowledge Bases unterstützt wird, sollten Sie die folgenden Hauptmerkmale der einzelnen Optionen berücksichtigen:
-
Aurora PostgreSQL — Relationale Daten mit Vektorfunktionen
-
Neptune Analytics — Graphbasierte Wissensrepräsentationen
-
OpenSearch Service — Schwerpunkt Suche und Analyse
-
Pinecone — Leistung bei der reinen Vektorsuche
-
Redis Enterprise Cloud — Anforderungen in Echtzeit und mit niedriger Latenz
Jede Implementierung bietet die folgenden einzigartigen Vorteile:
-
Aurora PostgreSQL — Am besten für Anwendungen, die sowohl traditionelle SQL- als auch Vektorfunktionen benötigen
-
Neptune Analytics — Ideal für komplexe beziehungsbasierte Abfragen und Wissensgraphen
-
OpenSearch Service — Stark in der Volltextsuche und -analyse
-
Pinecone — Optimiert für reine Vektoroperationen
-
Redis Enterprise Cloud — Am besten für Echtzeitanwendungen
Im Folgenden sind einige wichtige Punkte aufgeführt, die Sie bei der Auswahl eines Vector Stores für Ihre RAG-Lösung berücksichtigen sollten:
-
Skalierbarkeit — Fähigkeit, große und wachsende Datenmengen effizient zu verarbeiten.
-
Abfrageleistung — Schnelle und effiziente Suchfunktionen für den nächsten Nachbarn.
-
Datenaufnahme — Bestehende Anforderungen an das Datenmodell. Support für verschiedene Datenformate und einfache Aufnahme.
-
Filterung und Rangfolge — Erweiterte Filter- und Rankingmechanismen für abgerufene Ergebnisse.
-
Integration — Nahtlose Integration mit anderen Systemen und Tools über APIs unsere Protokolle.
-
Persistenz und Haltbarkeit — Geeignete Optionen für Beständigkeit und Haltbarkeit (speicherintern oder festplattenbasiert).
-
Parallelität und Konsistenz — Effizienter Umgang mit gleichzeitigem Zugriff und Datenkonsistenz.
-
Lizenzierung und Kosten — Bewertung des Lizenzmodells, der Vorabkosten und der laufenden Kosten sowie Bindung an einen bestimmten Anbieter.
-
Community und Support — Lebendige Community und umfassende Dokumentation.
-
Sicherheit und Compliance — Einhaltung der erforderlichen Sicherheits- und Compliance-Anforderungen.