工作方式 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

工作方式

Amazon Bedrock 的知识库可帮助您利用检索增强生成 (RAG),这是一种流行的技术,涉及从数据存储中提取信息以增强大型语言模型 (LLM) 生成的响应。如果使用数据来源建立知识库,应用程序就可以查询该知识库以返回信息,通过直接引用数据来源或使用根据查询结果生成的自然响应来回答查询。

借助知识库,您可以使用在查询知识库时接收到的上下文来丰富自己构建的应用程序。它从繁重的建筑管道中抽象出来,为您提供 out-of-the-box RAG解决方案来缩短应用程序的构建时间,从而缩短上市时间。添加知识库还可以提高成本效益,因为无需持续训练模型即可利用您的私有数据。

下面的示意图说明了 RAG 的执行方法。知识库可以通过自动执行 RAG 的设置和实施中的几个步骤来简化这个过程。

预处理数据

为了能够有效检索私有数据,通常的做法是先将文档拆分为可管理的数据块,以便进行有效检索。然后将这些数据块转换为嵌入内容并写入向量索引,同时保持与原文档的映射。这些嵌入内容用于确定查询和数据来源文本之间的语义相似性。下图说明了如何预处理向量数据库的数据。

预处理数据以实现检索增强生成

运行时执行

在运行时,使用嵌入模型将用户的查询转换为向量。然后,通过将文档向量与用户查询向量进行比较来查询向量索引,查找与用户查询在语义上相似的数据块。最后,使用从向量索引中检索到的数据块中的附加上下文来增强用户提示。接下来,将提示和附加上下文一起发送给模型,以便为用户生成响应。下图说明了 RAG 如何在运行时运行以增强对用户查询的响应。

运行时检索增强生成