是什么
检索增强生成(Retrieval-Augmented Generation,RAG)是一种让大模型「带着资料答题」的技术。它在模型生成回答之前,先根据用户的问题,从外部知识库(文档、网页、数据库等,通常以向量检索实现)里找出最相关的若干片段,再把这些片段连同问题一起喂给模型,让模型基于这些材料来作答,而不是只靠训练时记住的知识。
为什么重要
大模型的知识止于训练截止日期,也记不住企业内部的私有资料,还容易在不知道时「一本正经地编造」。RAG 把模型与一个可随时更新的外部知识库连起来,既补上了时效与私域知识的盲区,又能把答案锚定到真实出处、降低编造。它是企业把大模型接入自家文档、做问答与客服的最主流落地方式之一。
在 AI 产业链中的位置
RAG 是 AI 产业链应用层的架构模式,它把模型层的通用能力与企业自己的数据接合起来,中间往往还要用到向量数据库等基础设施层组件。相比训练或微调一个专有模型,RAG 改动小、更新快,是多数应用接入私域知识时的首选路径。