向量 - Amazon Simple Storage Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

向量

注意

Amazon S3 Vectors 目前為 Amazon Simple Storage Service 的預覽版本,可能會有所變更。

每個向量都包含一個索引鍵,可唯一識別向量索引中的每個向量。此外,您可以將中繼資料 (例如年份、作者、類型、位置) 做為索引鍵值對連接到每個向量。

向量資料操作包括插入、列出、查詢和刪除向量。若要產生非結構化資料的新向量內嵌,您可以使用 Amazon Bedrock 的 InvokeModel API 操作來指定您要使用的內嵌模型的模型 ID。此外,開放原始碼 Amazon S3 Vectors 內嵌 CLI 工具提供從命令列產生內嵌和執行語意搜尋的簡化方法。如需此開放原始碼工具使用 Amazon Bedrock 基礎模型和 S3 向量索引內的語意搜尋操作自動產生向量的詳細資訊,請參閱 使用 建立向量內嵌和執行語意搜尋 s3vectors-embed-cli

向量概念

向量索引鍵:每個向量都由索引內的唯一向量索引鍵識別。向量索引鍵的長度上限為 1,024 個字元,而且在向量索引中必須是唯一的。金鑰區分大小寫,可包含任何 UTF-8 字元。

向量維度:維度是向量中的值數量。較大的維度需要更多的儲存空間。索引中的所有向量都必須具有相同數量的維度,這些維度會在您建立索引時指定。維度必須是介於 1 到 4096 之間的整數。

中繼資料:您可以將中繼資料連接至向量做為索引鍵/值對,以提供其他內容,並在查詢期間啟用篩選。中繼資料包含可篩選和不可篩選的中繼資料金鑰。可篩選中繼資料用於查詢篩選。不可篩選的中繼資料金鑰會在向量索引建立期間指定,並提供其他內容,但無法用於篩選。中繼資料支援字串、數字和布林值類型。如需可篩選和不可篩選中繼資料的詳細資訊,請參閱中繼資料篩選。如需中繼資料限制的詳細資訊,包括每個向量的大小限制和每個向量的最大中繼資料金鑰,請參閱限制和限制