模型微调 Fine-tuning · 百科

是什么

微调（Fine-tuning）是指在一个已经过大规模预训练的基础模型之上，用规模小得多、但更贴近特定领域或任务的数据继续训练，从而调整模型权重、让它更擅长某类工作。常见做法包括全参数微调，以及只更新少量参数的高效微调（如 LoRA），后者大幅降低了显存与算力门槛。

预训练让模型具备通用能力，微调则把这份通用能力「校准」到具体场景——例如让模型熟悉某个行业的术语、遵循固定的输出格式、或贴合企业的语气规范。对开源权重模型而言，微调是把公开模型变成专有资产的主要手段；它也是「用更小的模型在窄任务上追平大模型」这一降本路线的关键一环。

微调是 AI 产业链中模型层的工程能力，但它的成本直接落在芯片与基础设施层——全参数微调对显存和算力要求很高，高效微调（LoRA 等）则把这道门槛降下来。向上，它让应用层能用得起贴合自身业务的定制模型，而不必每件事都依赖最贵的旗舰通用模型。

可自行微调的主要是开源权重系列，见开源大模型切片；各模型的价格与上下文窗口见大模型库总表。

常见问题

微调和提示词（prompt）有什么区别？

提示词是在不改动模型参数的前提下、靠输入引导模型；微调则真正更新模型权重，让能力「内化」。提示词成本低、即时生效；微调需要数据、算力和时间，但对固定任务更稳定。

微调一定比直接用大模型好吗？

不一定。对多数任务，先做提示词工程或用检索增强（RAG）往往更划算；只有当任务高度专门、对风格或格式要求严格、且手里有足够高质量数据时，微调才更值得。

闭源模型能微调吗？

部分闭源厂商提供托管微调服务（上传数据、由厂商训练并托管），但通常无法导出权重；开源权重模型则可自行微调与部署。具体以各厂商说明为准。