向量 - Amazon Simple Storage Service

向量

注意

适用于 Amazon Simple Storage Service 的 Amazon S3 Vectors 为预览版,可能会发生变化。

每个向量都由一个键组成,该键唯一标识向量索引中的每个向量。此外,可以将元数据(例如年份、作者、流派、地点)作为键值对附加到每个向量。

向量数据操作包括插入、列出、查询和删除向量。要生成非结构化数据的新向量嵌入,可以使用 Amazon Bedrock 中的 InvokeModel API 操作来指定要使用的嵌入模型的模型 ID。此外,开源 Amazon S3 Vectors Embed CLI 工具提供了一种从命令行生成嵌入和执行语义搜索的简化方法。此开源工具可使用 Amazon Bedrock 基础模型自动生成向量嵌入,并在 S3 向量索引中自动执行语义搜索操作。有关该工具的更多信息,请参阅使用 s3vectors-embed-cli 创建向量嵌入并执行语义搜索

向量概念

向量键:每个向量都由索引中的唯一向量键标识。向量键最多可包含 1024 个字符,并且向量索引中必须是唯一的。键区分大小写,并可以包含任何 UTF-8 字符。

向量维度:维度是向量中值的数量。维度越大,需要的存储空间越多。索引中的所有向量必须具有相同数量的维度,这是在创建索引时指定的。维度必须是 1 和 4096 之间的整数。

元数据:可以将元数据作为键值对附加到向量,以提供其它上下文并在查询期间启用筛选。元数据同时包括可筛选和不可筛选的元数据键。可筛选的元数据用于查询筛选。不可筛选的元数据键是在创建向量索引时指定的,可提供其它上下文,但不能用于筛选。元数据支持字符串、数字和布尔值类型。有关可筛选和不可筛选的元数据的更多信息,请参阅元数据筛选。有关元数据限制(包括每个向量的大小限制和每个向量的最大元数据键数)的更多信息,请参阅限制和局限性