是什麼
開源大模型通常指把訓練好的模型權重(weights)公開發布、允許任何人下載並在自己的硬件上運行、微調的大模型,如 Llama、通義千問(Qwen)、DeepSeek、Mistral、Gemma 等系列。這裡要區分兩個概念:「開源權重」(open weight)只公開權重文件,未必提供訓練數據與完整訓練代碼;「完全開源」(open source)則連數據、代碼、訓練方法一併公開。多數所謂「開源模型」其實是前者。
為什麼重要
開源權重打破了只能通過廠商 API 調用閉源模型的格局:企業可私有化部署以滿足數據合規、可深度微調出垂直模型、也不必為每次調用付費給某一家廠商。它還把模型能力的價格不斷打到地板——開源模型的免費或低價供給,持續壓低整個 token 市場的價格。但「開源」也有邊界:不少許可證(如 Llama 社區許可)對商用規模、再訓練設有附加限制,並非完全自由。
與五層蛋糕的關係
開源大模型處在「模型」層,卻深刻影響上下層。向下,私有化部署把算力需求從廠商雲端分散到自建「基礎設施」;向上,它給「應用」層提供了可自由改造、不被單一廠商鎖定的能力底座,是混合路由、垂直微調等玩法的基礎。
在大模型庫查
本站大模型庫收錄了主流廠商的可調用模型;其中開源/開源權重系列見開源大模型切片,國產開源模型(多數提供人民幣計價)見國產大模型。