運作方式 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

運作方式

Amazon 基岩的知識庫可協助您利用擷取增強產生 (RAG),這是一種熱門技術,可從資料存放區繪製資訊以增強大型語言模型 (LLM) 產生的回應。當您使用資料來源設定知識庫時,您的應用程式可以查詢知識庫以傳回資訊,以使用來源的直接引述,或從查詢結果產生的自然回應來回答查詢。

透過知識庫,您可以建置由查詢知識庫所收到的內容來充實應用程式。藉由從繁重的建置管線中抽象化,並提供 out-of-the-box RAG 解決方案,以減少應用程式的建置時間,藉此加快上市時間。新增知識庫也可提高成本效益,因為不需要持續訓練模型來利用您的私有資料。

以下圖表以圖解方式說明 RAG 的進行方式。知識庫透過自動執行此過程中的幾個步驟,簡化 RAG 的設定和實作。

預先處理資料

若要有效擷取私有資料,常見的做法是先將文件分割成可管理的區塊,以方便有效率的擷取。然後,區塊會轉換為內嵌項目,並寫入向量索引,同時保持與原始文件映射。這些內嵌項用於確定查詢和資料來源的文字之間的語意相似性。下圖說明了向量資料庫資料的預先處理。

預先處理資料以進行檢索增強生成

執行期執行

在執行期,內嵌模型用於將使用者的查詢轉換為向量。然後查詢向量索引,藉由將文件向量與使用者查詢向量進行比較,以尋找語意與使用者查詢類似的區塊。在最後一個步驟中,使用從向量索引擷取的區塊中的其他內容來增強使用者提示。然後,提示與附加上下文一起傳送到模型,為使用者產生回應。下圖說明 RAG 如何在執行期運作,以增強對使用者查詢的回應。

在執行期檢索增強生成