是什么
微调(Fine-tuning)是指在一个已经过大规模预训练的基础模型之上,用规模小得多、但更贴近特定领域或任务的数据继续训练,从而调整模型权重、让它更擅长某类工作。常见做法包括全参数微调,以及只更新少量参数的高效微调(如 LoRA),后者大幅降低了显存与算力门槛。
为什么重要
预训练让模型具备通用能力,微调则把这份通用能力「校准」到具体场景——例如让模型熟悉某个行业的术语、遵循固定的输出格式、或贴合企业的语气规范。对开源权重模型而言,微调是把公开模型变成专有资产的主要手段;它也是「用更小的模型在窄任务上追平大模型」这一降本路线的关键一环。
在 AI 产业链中的位置
微调是 AI 产业链中模型层的工程能力,但它的成本直接落在芯片与基础设施层——全参数微调对显存和算力要求很高,高效微调(LoRA 等)则把这道门槛降下来。向上,它让应用层能用得起贴合自身业务的定制模型,而不必每件事都依赖最贵的旗舰通用模型。