将您的数据源与 Amazon Bedrock 知识库同步

创建知识库后，将数据源/数据源提取到知识库中，以便对它们进行索引并可供查询。Ingestion 会将数据源中的原始数据转换为矢量嵌入。在开始摄取之前，请检查您的数据源是否满足以下条件：

每次在数据源中添加、修改或删除文件时，都必须同步数据源，以便将其重新索引到知识库中。同步是增量式的，因此 Amazon Bedrock 仅处理自上次同步以来添加、修改或删除的文档。

要了解如何将数据源提取到知识库中，请选择与您选择的方法相对应的选项卡，然后按照步骤进行操作。

Console

API

要将数据源提取到您为知识库配置的矢量存储中，请使用适用于 Amazon Bedrock 的代理构建时终端节点发送StartIngestionJob请求。指定knowledgeBaseId和dataSourceId。

在 Amazon Bedrock 代理构建时终端节点的 GetIngestionJob请求中使用响应中ingestionJobId返回的内容来跟踪摄取任务的状态。此外，请指定knowledgeBaseId和dataSourceId。

您还可以使用适用于 Amazon Bedrock 的代理构建时终端节点发送ListIngestionJobs请求，从而查看数据源的所有摄取任务的信息。指定要将knowledgeBaseId数据采集到的知识库的dataSourceId和。

通过在 filters 对象中指定要搜索的状态来筛选结果。
通过指定 sortBy 对象，按作业启动时间或作业状态进行排序。您可以按升序或降序进行排序。
在 maxResults 字段中设置要在响应中返回的结果数量上限。如果结果多于您设置的数字，则响应会返回一个nextToken，您可以在另一个ListIngestionJobs请求中发送该请求以查看下一批作业。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

网络爬虫

测试知识库