谷歌開源模型Gemma 4 12B：筆記本16GB記憶體跑多模態AI

開源模型Gemma 4 12B原生處理文本/影像/音訊，效能接近26B模型，商用Apache 2.0許可。

來源:The Decoder · 2026-06-03 15:54 ET · #模型

字號

谷歌DeepMind近日推出了開源模型Gemma 4 12B，這是一款能夠在普通筆記型電腦上原生執行的多模態AI系統。該模型擁有120億引數，可同時處理文本、影像和音訊輸入，最引人注目的是其極低的硬體需求：僅需16GB記憶體即可流暢執行，無需依賴昂貴的雲端GPU或專用AI加速卡。在多項基準測試中，Gemma 4 12B的效能幾乎與引數量高達260億的同類模型持平，展現出驚人的效率。該模型以Apache 2.0許可證釋出，明確允許商業使用，為開發者和企業提供了靈活的整合路徑。

這一發布建立在谷歌Gemma系列開源模型的演進之上。此前，Gemma模型主要聚焦於純文本任務，而Gemma 4 12B首次將多模態能力引入該家族，且直接瞄準了消費級硬體。傳統上，處理影像和音訊的多模態模型往往需要龐大的算力支援，部署在資料中心或高階工作站上。Gemma 4 12B通過架構最佳化和訓練策略的創新，成功將模型壓縮至可在16GB記憶體的筆記本上執行，這意味著普通使用者無需額外購置硬體即可在本地運行復雜的AI任務，例如即時影像描述、音訊轉錄或結合視覺與語音的互動應用。

從產業視角看，這一進展觸及了黃仁勳“五層蛋糕”框架中的模型層與應用層。在模型層，它證明了通過工程最佳化而非單純擴大引數規模，同樣能實現高效能多模態處理，這可能影響未來模型研發的資源分配方向。在應用層，邊緣部署能力的提升將直接推動AI應用向移動裝置、物聯網終端和本地化服務滲透，減少對網路延遲和雲端算力的依賴。對於投資者而言，這暗示著端側AI晶片、記憶體技術以及基於本地模型的應用生態可能迎來新的增長動力，同時也對依賴雲端推理服務的商業模式構成潛在挑戰。谷歌選擇Apache 2.0許可，進一步降低了商業採用的法律門檻，可能加速企業級本地AI解決方案的落地。

谷歌開源模型Gemma 4 12B：筆記本16GB記憶體跑多模態AI

延伸閱讀

相關深度報道

相關每日新聞