本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon Bedrock 知识库允许您在一个步骤中修改数据源并同步更改。如果您的知识库已连接到以下类型的数据源之一,则可以利用此功能:
-
Amazon S3
-
自定义
通过直接摄取,您只需一个操作即可直接在知识库中添加、更新或删除文件,您的知识库无需同步即可访问文档。直接摄取使用 KnowledgeBaseDocuments
API 操作将您直接提交到为知识库设置的矢量存储中的文档编制索引。您还可以通过这些操作直接查看知识库中的文档,而不必导航到连接的数据源进行查看。
与同步数据源的区别
Amazon Bedrock 知识库还提供了一组与同步数据源相关的 IngestionJob
API 操作。当您将数据源与StartIngestionJob请求同步时,Amazon Bedrock 知识库会扫描连接的数据源中的每个文档,并验证是否已将其索引到为知识库设置的矢量存储中。如果没有,它就会被索引到矢量存储中。
通过IngestKnowledgeBaseDocuments请求,您可以提交一组文档,直接将其索引到矢量存储中。因此,您可以跳过向数据源中添加文档的步骤。要了解这两组 API 操作的用例,请参阅以下段落:
如果您使用自定义数据源
您无需同步或使用这些IngestionJob
操作。通过操作或在KnowledgeBaseDocuments
操作中添加、修改或删除的文档将 AWS Management Console 成为自定义数据源和知识库的一部分。
如果您使用 Amazon S3 数据源
您可以在不同的用例中使用这两组操作:
-
首次将知识库连接到 S3 数据源后,您必须通过 Amazon Bedrock API 提交StartIngestionJob请求来同步 AWS Management Console 或中的数据源。
-
将文档索引到为知识库设置的矢量存储中,或者通过以下方式移除已编入索引的文档:
-
将文档添加到您的 S3 位置或从中删除文档。然后在中同步您的数据源 AWS Management Console 或在 API 中提交
StartIngestionJob
请求。有关同步和StartIngestionJob
操作的详细信息,请参阅将您的数据与 Amazon Bedrock 知识库同步。 -
通过
IngestKnowledgeBaseDocuments
请求直接将 S3 文档摄取到知识库中。有关直接摄取文档的详细信息,请参阅。将文档直接摄取到知识库中警告
对于 S3 数据源,您直接在知识库中 AWS Management Console 或
KnowledgeBaseDocuments
通过 API 操作索引到知识库中的任何更改都不会反映在 S3 位置中。您可以使用这些 API 操作,只需一个步骤即可立即对知识库进行更改。但是,您应该继续在 S3 位置中进行相同的更改,这样下次在 AWS Management Console 或中同步数据源时,这些更改就不会被覆盖。StartIngestionJob
不要同时提交
IngestKnowledgeBaseDocuments
和StartIngestionJob
请求。
-
选择一个主题,了解如何直接摄取数据源中的文档: