检索增强生成 RAG · 百科

是什么

检索增强生成（Retrieval-Augmented Generation，RAG）是一种让大模型「带着资料答题」的技术。它在模型生成回答之前，先根据用户的问题，从外部知识库（文档、网页、数据库等，通常以向量检索实现）里找出最相关的若干片段，再把这些片段连同问题一起喂给模型，让模型基于这些材料来作答，而不是只靠训练时记住的知识。

为什么重要

大模型的知识止于训练截止日期，也记不住企业内部的私有资料，还容易在不知道时「一本正经地编造」。RAG 把模型与一个可随时更新的外部知识库连起来，既补上了时效与私域知识的盲区，又能把答案锚定到真实出处、降低编造。它是企业把大模型接入自家文档、做问答与客服的最主流落地方式之一。

在 AI 产业链中的位置

RAG 是 AI 产业链应用层的架构模式，它把模型层的通用能力与企业自己的数据接合起来，中间往往还要用到向量数据库等基础设施层组件。相比训练或微调一个专有模型，RAG 改动小、更新快，是多数应用接入私域知识时的首选路径。

在大模型库查

RAG 与长上下文是处理大量资料的两条路线，可在长上下文切片对比各模型的上下文窗口与价格；全部模型见大模型库总表。

常见问题

RAG 和直接把资料贴进提示词有什么区别？

本质相同——都是把外部资料喂给模型。区别在于 RAG 会先从大量文档里自动「检索」出最相关的片段再喂入，适合知识库很大、无法一次塞进上下文的场景。

RAG 和长上下文模型怎么选？

长上下文把全部材料一次塞进请求，简单但更贵、且材料越长模型越可能「读漏」；RAG 只取相关片段，省 token、便于更新知识，但需要搭建检索系统。两者常结合使用。

RAG 能完全杜绝模型编造吗？

不能，但能显著降低。把答案锚定到检索出的真实资料、并要求模型标注出处，可以减少凭空编造；检索不到或片段不相关时，仍可能出错。

是什么

为什么重要

在 AI 产业链中的位置

在大模型库查

常见问题

参考来源

相关新闻

相关条目