智譜發佈旗艦模型 GLM-5.2：首次實現百萬 token 穩定上下文

智譜 AI 近日通過 Hugging Face 平臺正式發佈了其新一代旗艦語言模型 GLM-5.2，模型參數高達 753B，並以 MIT 許可證完全開源，不設地域限制。這一發布標誌著智譜在長週期任務處理能力上邁出了關鍵一步，其核心突破在於首次在百萬 token 的上下文窗口上實現了穩定、可靠的表現，而此前這類超長上下文往往面臨注意力衰減與性能不穩定的挑戰。

從技術指標來看，GLM-5.2 在多個權威基準測試中展現出對前代 GLM-5.1 的全面超越。在推理能力方面，HLE 得分從 31 躍升至 40.5，CritPt 更是從 4.6 飆升至 20.9，顯示出模型在複雜邏輯與批判性思維任務上的顯著進步。編碼能力同樣大幅增強，SWE-bench Pro 從 58.4 提升至 62.1，FrontierSWE 更是從 30.5 翻倍至 74.4，而 SWE-Marathon 這類長週期編碼任務則從 1.0 提升至 13.0，儘管絕對分數仍不高，但相對增幅巨大，印證了其對長週期任務的針對性優化。

支撐這些性能提升的是一項名為 IndexShare 的新架構設計。該技術讓每四個稀疏注意力層共享同一個索引器，從而在百萬 token 的上下文長度下，將每個 token 所需的浮點運算量降低了 2.9 倍。這意味著模型在處理超長文本時，計算效率得到顯著優化，有助於在實際部署中控制推理成本。此外，GLM-5.2 還改進了多 token 預測層，使推測解碼的接受長度最高提升了 20%，進一步加快了生成速度。

GLM-5.2 的發佈恰逢大模型競爭進入長上下文與智能體能力比拼的階段。當前，包括 OpenAI、Anthropic、谷歌、阿里等在內的主要玩家都在推動模型處理更長文本、執行更復雜的多步驟任務。智譜此次將百萬 token 穩定上下文與 MIT 開源協議結合，既展示了其技術實力，也為開發者社區提供了一個可自由商用、無地域限制的強有力工具。這對於需要處理大型代碼庫、長文檔分析或複雜智能體工作流的應用場景尤為關鍵。

從產業角度看，GLM-5.2 的開源策略可能對算力市場產生雙重影響。一方面，模型參數高達 753B，本地部署需要可觀的 GPU 資源，這將直接拉動對高端 AI 芯片與服務器的需求；另一方面，IndexShare 等效率優化技術又在一定程度上降低了單位 token 的計算成本，使得大規模推理變得更加經濟。智譜同時提供了通過 Z.ai API 平臺訪問模型的方式，為不同規模的用戶提供了靈活的選擇。

在部署生態上，GLM-5.2 已獲得多個主流框架的支持，包括 SGLang、vLLM、Transformers、KTransformers 以及 Unsloth，甚至支持在華為昇騰 NPU 平臺上通過 vLLM-Ascend 等框架進行推理。這種廣泛的框架兼容性降低了開發者的遷移門檻，有助於模型快速在社區中擴散。

值得注意的是，GLM-5.2 在智能體相關基準上也表現不俗。在 MCP-Atlas 公開集上得分 76.8，Tool-Decathlon 得分 48.2，顯示出其在工具調用與多步驟任務執行上的潛力。這與智譜在技術報告中強調的“從氛圍編碼到智能體工程”的演進方向一致，表明模型正從單純的文本生成向更復雜的自主任務執行邁進。

總體而言，GLM-5.2 的發佈不僅是智譜在模型能力上的一次升級，更是在開源生態與長週期任務處理上的一次重要佈局。它將百萬 token 穩定上下文、高效推理架構與寬鬆的開源許可相結合，為 AI 應用開發者提供了新的基礎選項，也可能進一步加劇大模型在長上下文與智能體賽道的競爭烈度。

智譜發佈旗艦模型 GLM-5.2：首次實現百萬 token 穩定上下文

延伸閱讀

相關深度報道

相關每日新聞