Bewährte Methoden für S3 Vectors

Amazon S3 Vectors bietet speziell entwickelten, kostenoptimierten Vektorspeicher für KI-fähige Anwendungen und die semantische Suche Ihrer in Amazon S3 gespeicherten Inhalte. S3 Vectors wurde entwickelt, um Elastizität und Haltbarkeit auf S3-Niveau für die Speicherung von Vektordatensätzen mit einer Abfrageleistung von unter einer Sekunde zu bieten. S3 Vectors ist ideal für Anwendungen, die Vektorindizes erstellen und erweitern müssen. Mit S3 Vectors können Sie spezielle API-Operationen verwenden, um Vektordaten zu speichern, darauf zuzugreifen und Ähnlichkeitsabfragen für Vektordaten durchzuführen, ohne eine Infrastruktur bereitstellen zu müssen. Weitere Informationen finden Sie unter Arbeiten mit S3-Vektoren und Vektor-Buckets.

Um den größtmöglichen Nutzen aus S3 Vectors zu ziehen, empfehlen wir Ihnen, die folgenden bewährten Methoden anzuwenden.

Vektoren einfügen und löschen: Ihre Anwendung kann mindestens fünf PutVectorsund DeleteVectorsAnfragen pro Sekunde pro Vektorindex erreichen. Wenn Sie die Anforderungsraten überschreiten, wird möglicherweise eine 429 TooManyRequestsException Fehlermeldung angezeigt. Um den Anforderungsdurchsatz zu maximieren und Geschwindigkeit und Effizienz zu optimieren, empfehlen wir, Vektoren in großen Batches einzufügen und zu löschen, bis zu einem Maximum von 500 Vektoren pro API-Anfrage. Weitere Informationen finden Sie unter Vektor-Indizes.
Zugreifen auf und Abfragen von Vektoren in einem S3-Vektorindex: Ihre Anwendung kann Hunderte von QueryVectors GetVectors, oder ListVectorsAnfragen pro Sekunde pro S3-Vektorindex erreichen. Wenn Sie die Anforderungsraten überschreiten, wird möglicherweise eine 429 TooManyRequestsException Fehlermeldung angezeigt. Wir empfehlen Ihnen, einen Wiederholungsmechanismus zu verwenden und Ihre Anwendung so zu konfigurieren, dass weniger Anfragen gesendet werden.
Skalierung über Vektorindizes hinweg: Um die Abfrageleistung pro Vektorindex zu verbessern, sollten Sie erwägen, Ihre Anwendung so zu konfigurieren, dass Vektoren nach Möglichkeit auf mehrere Vektorindizes aufgeteilt werden. Wenn Sie beispielsweise mehrinstanzenfähige Workloads haben und Ihre Anwendung jeden Mandanten unabhängig abfragt, sollten Sie erwägen, die Vektoren jedes Mandanten in einem separaten Vektorindex zu speichern. Weitere Informationen finden Sie unter Vektor-Indizes.
Implementierung von Mehrmandantenfähigkeit mit separaten Vektorindizes: Sie können eine Mehrmandantenfähigkeit erreichen, indem Sie Ihre Vektordaten mit einem einzigen Vektorindex für jeden Mandanten organisieren. Sie können IAM- und Bucket-Richtlinien verwenden, um den Zugriff jedes Mandanten nur auf seinen bestimmten Vektorindex zu beschränken. Dieser Ansatz trägt zur Aufrechterhaltung der Datenisolierung bei und vereinfacht die Verwaltung, da keine separaten Buckets für jeden Mandanten erstellt werden müssen. Weitere Informationen finden Sie unter Identitäts- und Zugriffsmanagement in S3 Vectors.
Konfiguration von nicht filterbaren Metadatenfeldern für Vektorindizes: Wenn Sie einen Vektorindex erstellen, konfigurieren Sie Metadatenfelder, die nicht gefiltert werden müssen, als nicht filterbare Metadatenschlüssel. Speichern Sie beispielsweise Textblöcke für Vektoreinbettungen als nicht filterbare Metadatenfelder, wenn Sie sie nur als Referenz benötigen. Weitere Informationen finden Sie unter Nicht filterbare Metadaten.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Begrenzungen und Einschränkungen

Vektoreinbettungen erstellen und durchsuchen mit s3vectors-embed-cli