是什麼

檢索增強生成(Retrieval-Augmented Generation,RAG)是一種讓大模型「帶著資料答題」的技術。它在模型生成回答之前,先根據用戶的問題,從外部知識庫(文檔、網頁、數據庫等,通常以向量檢索實現)裡找出最相關的若干片段,再把這些片段連同問題一起餵給模型,讓模型基於這些材料來作答,而不是隻靠訓練時記住的知識。

為什麼重要

大模型的知識止於訓練截止日期,也記不住企業內部的私有資料,還容易在不知道時「一本正經地編造」。RAG 把模型與一個可隨時更新的外部知識庫連起來,既補上了時效與私域知識的盲區,又能把答案錨定到真實出處、降低編造。它是企業把大模型接入自家文檔、做問答與客服的最主流落地方式之一。

在 AI 產業鏈中的位置

RAG 是 AI 產業鏈應用層的架構模式,它把模型層的通用能力與企業自己的數據接合起來,中間往往還要用到向量數據庫等基礎設施層組件。相比訓練或微調一個專有模型,RAG 改動小、更新快,是多數應用接入私域知識時的首選路徑。

在大模型庫查

RAG 與長上下文是處理大量資料的兩條路線,可在長上下文切片對比各模型的上下文窗口與價格;全部模型見大模型庫總表。