是什么
开源大模型通常指把训练好的模型权重(weights)公开发布、允许任何人下载并在自己的硬件上运行、微调的大模型,如 Llama、通义千问(Qwen)、DeepSeek、Mistral、Gemma 等系列。这里要区分两个概念:「开源权重」(open weight)只公开权重文件,未必提供训练数据与完整训练代码;「完全开源」(open source)则连数据、代码、训练方法一并公开。多数所谓「开源模型」其实是前者。
为什么重要
开源权重打破了只能通过厂商 API 调用闭源模型的格局:企业可私有化部署以满足数据合规、可深度微调出垂直模型、也不必为每次调用付费给某一家厂商。它还把模型能力的价格不断打到地板——开源模型的免费或低价供给,持续压低整个 token 市场的价格。但「开源」也有边界:不少许可证(如 Llama 社区许可)对商用规模、再训练设有附加限制,并非完全自由。
与五层蛋糕的关系
开源大模型处在「模型」层,却深刻影响上下层。向下,私有化部署把算力需求从厂商云端分散到自建「基础设施」;向上,它给「应用」层提供了可自由改造、不被单一厂商锁定的能力底座,是混合路由、垂直微调等玩法的基础。
在大模型库查
本站大模型库收录了主流厂商的可调用模型;其中开源/开源权重系列见开源大模型切片,国产开源模型(多数提供人民币计价)见国产大模型。