谷歌釋出Gemma 4 12B模型，16GB記憶體筆記本即可執行

谷歌推出Gemma 4 12B模型，採用新編碼與預測技術，可在16GB記憶體筆記本上執行。

來源:Ars Technica — AI · 2026-06-03 15:10 ET · #模型

字號

谷歌近日正式釋出Gemma系列最新成員——Gemma 4 12B，這是一款引數規模為120億的開源語言模型。與以往追求極致引數量的路線不同，該模型的核心賣點在於極低的硬體門檻：官方明確表示，任何配備16GB記憶體的筆記型電腦均可流暢執行，無需獨立顯示卡或雲端算力支援。

這一突破得益於兩項關鍵技術革新。首先，Gemma 4 12B採用了全新的編碼方案，在模型架構層面優化了資料表示效率，減少了記憶體佔用與計算冗餘。其次，其令牌預測機制經過重新設計，能夠以更少的計算步驟完成同等質量的文本生成，從而在有限硬體資源下實現“以小博大”的效能表現。谷歌未披露具體基準測試資料，但強調該模型在推理速度與資源消耗比上顯著優於同參數級別的競品。

從產業背景看，當前主流大語言模型的部署高度依賴雲端GPU叢集或高階本地工作站，這限制了AI在移動場景、邊緣裝置及隱私敏感領域的普及。谷歌此次將12B引數模型壓縮至消費級筆記本可執行的範圍，並非簡單的量化或蒸餾技術所能實現，而是從底層架構出發的系統性最佳化。這與Meta的Llama系列、微軟Phi系列等追求端側部署的趨勢一脈相承，但Gemma 4 12B在引數規模與硬體門檻的平衡點上更為激進。

在“五層蛋糕”框架中，該模型直接作用於模型層與應用層的交界處。它降低了開發者與中小企業在本地進行模型微調、原型驗證的門檻，可能催生更多基於私有資料、無需聯網的垂直應用。同時，對輝達等晶片廠商而言，雖然短期內雲端訓練需求不受影響，但邊緣推理算力需求的增長路徑可能因此類模型的出現而加速分化——部分推理任務從資料中心GPU轉向消費級CPU或NPU，這為英特爾、高通及ARM生態的AI加速硬體提供了新的敘事空間。

值得關注的是，谷歌選擇將Gemma 4 12B作為開源模型釋出，延續了其通過開放生態培育開發者社群、間接擴大雲服務觸達面的策略。開發者可在筆記型電腦上完成模型除錯後，再按需擴充套件至谷歌雲的TPU或GPU例項進行大規模訓練，形成“本地開發-雲端擴充套件”的閉環。這一模式若被廣泛採納，可能重塑AI應用開發的工具鏈與成本結構。

谷歌釋出Gemma 4 12B模型，16GB記憶體筆記本即可執行

延伸閱讀

相關深度報道

相關每日新聞