本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将您的数据与 Amazon Bedrock 知识库同步
创建知识库后,您可以提取或同步数据,以便可以查询数据。Ingestion 会将数据源中的原始数据转换为矢量嵌入。在开始摄取之前,请检查您的数据源是否满足以下条件:
-
您已经为数据源配置了连接信息。要配置数据源连接器以从数据源存储库中抓取数据,请参阅支持的数据源连接器。
-
这些文件采用支持的格式。有关更多信息,请参阅 Su pport 文档格式。
-
文件不超过中指定的最大文件大小知识库配额。
-
如果您的数据源包含元数据文件,请检查以下条件以确保元数据文件不会被忽略:
-
每个
.metadata.json
文件都与其关联的源文件共享相同的文件名和扩展名。 -
如果知识库的向量索引位于 Amazon OpenSearch Serverless 矢量存储中,请检查该
faiss
引擎是否配置了矢量索引。如果使用引nmslib
擎配置了向量索引,则必须执行以下操作之一:-
在控制台中@@ 创建新的知识库,让 Amazon Bedrock 在 Amazon OpenSearch Serverless 中自动为你创建矢量索引。
-
在@@ 矢量存储中创建另一个向量索引,然后选择
faiss
作为引擎。然后创建新的知识库并指定新的向量索引。
-
-
如果知识库的向量索引位于 Amazon Aurora 数据库集群中,请在开始摄取之前,检查您的索引表是否包含元数据文件中每个元数据属性的列。
-
注意
每次在数据源中添加、修改或删除文件时,都必须同步数据源,以便将其重新索引到知识库中。同步是增量式的,因此 Amazon Bedrock 仅处理自上次同步以来添加、修改或删除的文档。
要了解如何同步数据源并将数据提取到知识库中,请选择与您选择的方法相对应的选项卡,然后按照步骤操作。