本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将您的数据源与 Amazon Bedrock 知识库同步
创建知识库后,将数据源/数据源提取到知识库中,以便对它们进行索引并可供查询。Ingestion 会将数据源中的原始数据转换为矢量嵌入。在开始摄取之前,请检查您的数据源是否满足以下条件:
-
您已经为数据源配置了连接信息。要配置数据源连接器以从数据源存储库中抓取数据,请参阅支持的数据源连接器。
-
这些文件采用支持的格式。有关更多信息,请参阅 Su pport 文档格式。
-
文件大小不超过 50 MB 的最大文件大小。有关更多信息,请参阅 知识库配额。
-
如果您的数据源包含元数据文件,请检查以下条件以确保元数据文件不会被忽略:
-
每个
.metadata.json
文件都与其关联的源文件同名。 -
如果知识库的向量索引位于 Amazon OpenSearch Serverless 矢量存储中,请检查该
faiss
引擎是否配置了矢量索引。如果使用引nmslib
擎配置了向量索引,则必须执行以下操作之一:-
在控制台中@@ 创建新的知识库,让 Amazon Bedrock 在 Amazon OpenSearch Serverless 中自动为你创建矢量索引。
-
在@@ 矢量存储中创建另一个向量索引,然后选择
faiss
作为引擎。然后创建新的知识库并指定新的向量索引。
-
-
如果知识库的向量索引位于 Amazon Aurora 数据库集群中,请在开始摄取之前,检查您的索引表是否包含元数据文件中每个元数据属性的列。
-
注意
每次在数据源中添加、修改或删除文件时,都必须同步数据源,以便将其重新索引到知识库中。同步是增量式的,因此 Amazon Bedrock 仅处理自上次同步以来添加、修改或删除的文档。
要了解如何将数据源提取到知识库中,请选择与您选择的方法相对应的选项卡,然后按照步骤进行操作。