開源大模型 Open-Weight Models · 百科

是什麼

開源大模型通常指把訓練好的模型權重（weights）公開發布、允許任何人下載並在自己的硬件上運行、微調的大模型，如 Llama、通義千問（Qwen）、DeepSeek、Mistral、Gemma 等系列。這裡要區分兩個概念：「開源權重」（open weight）只公開權重文件，未必提供訓練數據與完整訓練代碼；「完全開源」（open source）則連數據、代碼、訓練方法一併公開。多數所謂「開源模型」其實是前者。

為什麼重要

開源權重打破了只能通過廠商 API 調用閉源模型的格局：企業可私有化部署以滿足數據合規、可深度微調出垂直模型、也不必為每次調用付費給某一家廠商。它還把模型能力的價格不斷打到地板——開源模型的免費或低價供給，持續壓低整個 token 市場的價格。但「開源」也有邊界：不少許可證（如 Llama 社區許可）對商用規模、再訓練設有附加限制，並非完全自由。

與五層蛋糕的關係

開源大模型處在「模型」層，卻深刻影響上下層。向下，私有化部署把算力需求從廠商雲端分散到自建「基礎設施」；向上，它給「應用」層提供了可自由改造、不被單一廠商鎖定的能力底座，是混合路由、垂直微調等玩法的基礎。

在大模型庫查

本站大模型庫收錄了主流廠商的可調用模型；其中開源/開源權重系列見開源大模型切片，國產開源模型（多數提供人民幣計價）見國產大模型。

常見問題

開源大模型和閉源模型哪個更好？

各有取捨。閉源前沿模型通常能力領先、開箱即用；開源模型勝在可私有部署、可微調、成本可控。選擇取決於對數據合規、定製化與成本的需求。

「開源權重」就是完全開源嗎？

不是。開源權重只公開模型權重文件，未必附帶訓練數據與代碼；完全開源還包括可復現的訓練數據與方法。許多開源許可證對商用規模也有附加限制。

個人能在自己電腦上跑開源大模型嗎？

小參數量的開源模型經量化後可在高配個人電腦或單張消費級顯卡上運行；但參數量大的旗艦開源模型仍需多卡服務器級硬件。

是什麼

為什麼重要

與五層蛋糕的關係

在大模型庫查

常見問題

參考來源

相關新聞

相關條目