智譜 AI 近日通過 Hugging Face 平臺正式發佈了其新一代旗艦語言模型 GLM-5.2,模型參數高達 753B,並以 MIT 許可證完全開源,不設地域限制。這一發布標誌著智譜在長週期任務處理能力上邁出了關鍵一步,其核心突破在於首次在百萬 token 的上下文窗口上實現了穩定、可靠的表現,而此前這類超長上下文往往面臨注意力衰減與性能不穩定的挑戰。
從技術指標來看,GLM-5.2 在多個權威基準測試中展現出對前代 GLM-5.1 的全面超越。在推理能力方面,HLE 得分從 31 躍升至 40.5,CritPt 更是從 4.6 飆升至 20.9,顯示出模型在複雜邏輯與批判性思維任務上的顯著進步。編碼能力同樣大幅增強,SWE-bench Pro 從 58.4 提升至 62.1,FrontierSWE 更是從 30.5 翻倍至 74.4,而 SWE-Marathon 這類長週期編碼任務則從 1.0 提升至 13.0,儘管絕對分數仍不高,但相對增幅巨大,印證了其對長週期任務的針對性優化。
支撐這些性能提升的是一項名為 IndexShare 的新架構設計。該技術讓每四個稀疏注意力層共享同一個索引器,從而在百萬 token 的上下文長度下,將每個 token 所需的浮點運算量降低了 2.9 倍。這意味著模型在處理超長文本時,計算效率得到顯著優化,有助於在實際部署中控制推理成本。此外,GLM-5.2 還改進了多 token 預測層,使推測解碼的接受長度最高提升了 20%,進一步加快了生成速度。
GLM-5.2 的發佈恰逢大模型競爭進入長上下文與智能體能力比拼的階段。當前,包括 OpenAI、Anthropic、谷歌、阿里等在內的主要玩家都在推動模型處理更長文本、執行更復雜的多步驟任務。智譜此次將百萬 token 穩定上下文與 MIT 開源協議結合,既展示了其技術實力,也為開發者社區提供了一個可自由商用、無地域限制的強有力工具。這對於需要處理大型代碼庫、長文檔分析或複雜智能體工作流的應用場景尤為關鍵。
從產業角度看,GLM-5.2 的開源策略可能對算力市場產生雙重影響。一方面,模型參數高達 753B,本地部署需要可觀的 GPU 資源,這將直接拉動對高端 AI 芯片與服務器的需求;另一方面,IndexShare 等效率優化技術又在一定程度上降低了單位 token 的計算成本,使得大規模推理變得更加經濟。智譜同時提供了通過 Z.ai API 平臺訪問模型的方式,為不同規模的用戶提供了靈活的選擇。
在部署生態上,GLM-5.2 已獲得多個主流框架的支持,包括 SGLang、vLLM、Transformers、KTransformers 以及 Unsloth,甚至支持在華為昇騰 NPU 平臺上通過 vLLM-Ascend 等框架進行推理。這種廣泛的框架兼容性降低了開發者的遷移門檻,有助於模型快速在社區中擴散。
值得注意的是,GLM-5.2 在智能體相關基準上也表現不俗。在 MCP-Atlas 公開集上得分 76.8,Tool-Decathlon 得分 48.2,顯示出其在工具調用與多步驟任務執行上的潛力。這與智譜在技術報告中強調的“從氛圍編碼到智能體工程”的演進方向一致,表明模型正從單純的文本生成向更復雜的自主任務執行邁進。
總體而言,GLM-5.2 的發佈不僅是智譜在模型能力上的一次升級,更是在開源生態與長週期任務處理上的一次重要佈局。它將百萬 token 穩定上下文、高效推理架構與寬鬆的開源許可相結合,為 AI 應用開發者提供了新的基礎選項,也可能進一步加劇大模型在長上下文與智能體賽道的競爭烈度。