檢索增強生成 RAG · 百科

是什麼

檢索增強生成（Retrieval-Augmented Generation，RAG）是一種讓大模型「帶著資料答題」的技術。它在模型生成回答之前，先根據用戶的問題，從外部知識庫（文檔、網頁、數據庫等，通常以向量檢索實現）裡找出最相關的若干片段，再把這些片段連同問題一起餵給模型，讓模型基於這些材料來作答，而不是隻靠訓練時記住的知識。

為什麼重要

大模型的知識止於訓練截止日期，也記不住企業內部的私有資料，還容易在不知道時「一本正經地編造」。RAG 把模型與一個可隨時更新的外部知識庫連起來，既補上了時效與私域知識的盲區，又能把答案錨定到真實出處、降低編造。它是企業把大模型接入自家文檔、做問答與客服的最主流落地方式之一。

在 AI 產業鏈中的位置

RAG 是 AI 產業鏈應用層的架構模式，它把模型層的通用能力與企業自己的數據接合起來，中間往往還要用到向量數據庫等基礎設施層組件。相比訓練或微調一個專有模型，RAG 改動小、更新快，是多數應用接入私域知識時的首選路徑。

在大模型庫查

RAG 與長上下文是處理大量資料的兩條路線，可在長上下文切片對比各模型的上下文窗口與價格；全部模型見大模型庫總表。

常見問題

RAG 和直接把資料貼進提示詞有什麼區別？

本質相同——都是把外部資料餵給模型。區別在於 RAG 會先從大量文檔裡自動「檢索」出最相關的片段再喂入，適合知識庫很大、無法一次塞進上下文的場景。

RAG 和長上下文模型怎麼選？

長上下文把全部材料一次塞進請求，簡單但更貴、且材料越長模型越可能「讀漏」；RAG 只取相關片段，省 token、便於更新知識，但需要搭建檢索系統。兩者常結合使用。

RAG 能完全杜絕模型編造嗎？

不能，但能顯著降低。把答案錨定到檢索出的真實資料、並要求模型標註出處，可以減少憑空編造；檢索不到或片段不相關時，仍可能出錯。

是什麼

為什麼重要

在 AI 產業鏈中的位置

在大模型庫查

常見問題

參考來源

相關新聞

相關條目