Vektor-Indizes - Amazon Simple Storage Service

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Vektor-Indizes

Anmerkung

Amazon S3 Vectors befindet sich in der Vorschauversion für Amazon Simple Storage Service und kann sich ändern.

Anmerkung

Wählen Sie Ihre Konfigurationsparameter für den Vektorindex sorgfältig aus. Nachdem Sie einen Vektorindex erstellt haben, können Sie den Namen, die Dimension, die Entfernungsmetrik oder die nicht filterbaren Metadatenschlüssel nicht mehr aktualisieren. Um einen dieser Werte zu ändern, müssen Sie einen neuen Vektorindex erstellen.

Vektorindizes sind Ressourcen innerhalb von Vektor-Buckets, in denen Vektordaten für effiziente Ähnlichkeitssuchen gespeichert und organisiert werden. Wenn Sie einen Vektorindex erstellen, geben Sie die Entfernungsmetrik (CosineoderEuclidean), die Anzahl der Dimensionen, die ein Vektor haben soll, und optional eine Liste von Metadatenfeldern an, die Sie bei Ähnlichkeitsabfragen von der Filterung ausschließen möchten.

Weitere Informationen zu Vektorindexgrenzwerten pro Bereich, Vektorgrenzwerte pro Index und Größenbeschränkungen pro Vektor finden Sie unterBegrenzungen und Einschränkungen.

Jeder Vektorindex hat einen eindeutigen Amazon-Ressourcennamen (ARN). Die ARNs Vektorindizes haben das folgende Format:

arn:aws:s3vectors:region:account-id:bucket/bucket-name/index/index-name

Anforderungen an die Benennung von Vektorindizes

  • Die Namen von Vektorindizes müssen innerhalb des Vektor-Buckets eindeutig sein.

  • Vektorindexnamen müssen zwischen 3 und 63 Zeichen lang sein.

  • Gültige Zeichen sind Kleinbuchstaben (a-z), Zahlen (0-9), Bindestriche (-) und Punkte (.).

  • Vektorindexnamen müssen mit einem Buchstaben oder einer Zahl beginnen und enden.

Anforderungen an die Abmessungen

Eine Dimension ist die Anzahl der Werte in einem Vektor. Alle dem Index hinzugefügten Vektoren müssen genau diese Anzahl von Werten haben.

  • Eine Dimension muss eine Ganzzahl zwischen 1 und 4096 sein.

  • Eine größere Dimension erfordert mehr Speicherplatz.

Metrische Optionen für Entfernungen

Die Entfernungsmetrik gibt an, wie die Ähnlichkeit zwischen Vektoren berechnet wird. Wählen Sie bei der Erstellung von Vektoreinbettungen die von Ihrem Einbettungsmodell empfohlene Entfernungsmetrik, um genauere Ergebnisse zu erzielen.

  • Kosinus — Misst den Kosinus des Winkels zwischen Vektoren. Am besten für normalisierte Vektoren und wenn die Richtung wichtiger ist als die Größe.

  • Euklidisch — Misst den geradlinigen Abstand zwischen Vektoren. Am besten, wenn sowohl Richtung als auch Größe wichtig sind.

Nicht filterbare Metadatenschlüssel

Mit Metadatenschlüsseln können Sie Ihren Vektoren beim Speichern und Abrufen zusätzliche Informationen als Schlüssel-Wert-Paare hinzufügen. Standardmäßig sind alle Metadaten filterbar, sodass Sie sie zum Filtern von Abfrageergebnissen verwenden können. Sie können jedoch bestimmte Metadatenschlüssel als nicht filterbar kennzeichnen, wenn Sie Informationen mit Vektoren speichern möchten, ohne sie zum Filtern zu verwenden.

Im Gegensatz zu Standard-Metadatenschlüsseln können diese Schlüssel nicht als Abfragefilter verwendet werden. Nicht filterbare Metadatenschlüssel können abgerufen, aber nicht gesucht, abgefragt oder gefiltert werden. Sie können erst darauf zugreifen, nachdem Sie den Index gefunden haben.

Mit nicht filterbaren Metadatenschlüsseln können Sie Vektoren mit zusätzlichem Kontext anreichern, den Sie mit Suchergebnissen abrufen möchten, aber nicht filtern müssen. Ein gängiges Beispiel für einen nicht filterbaren Metadatenschlüssel ist, wenn Sie Text in Vektoren einbetten und den Originaltext selbst als nicht filterbare Metadaten einbeziehen möchten. Auf diese Weise können Sie den Quelltext zusammen mit Vektorsuchergebnissen zurückgeben, ohne die Größenbeschränkungen für filterbare Metadaten zu erhöhen. Andere Beispiele umfassen das Speichern von Erstellungszeitstempeln, Quellinformationen oder beschreibenden Informationen URLs, die lediglich als Referenz dienen. Beim Abrufen von Vektoren kann auf nicht filterbare Metadatenschlüssel zugegriffen werden. Im Gegensatz zu Standard-Metadatenschlüsseln können diese Schlüssel jedoch nicht als Abfragefilter verwendet werden.

Die Anforderungen für nicht filterbare Metadatenschlüssel lauten wie folgt.

  • Nicht filterbare Metadatenschlüssel müssen innerhalb des Vektorindex eindeutig sein.

  • Nicht filterbare Metadatenschlüssel müssen 1 bis 63 Zeichen lang sein.

  • Nicht filterbare Metadatenschlüssel können nach der Erstellung des Vektorindex nicht geändert werden.

  • S3-Vektoren unterstützen bis zu 10 nicht filterbare Metadatenschlüssel pro Index.