智譜AI近日通過Hugging Face平臺正式發佈了其最新旗艦大語言模型GLM-5.2。這款參數規模高達753B的模型,以MIT開源許可證全面開放,無地域限制,標誌著智譜在長程任務處理能力上邁出了關鍵一步。
GLM-5.2的核心突破在於其首次實現了對百萬token上下文窗口的穩定支持。與上一代GLM-5.1相比,新模型不再僅僅是在理論上支持長上下文,而是能夠在長達百萬token的連續任務中保持穩定的推理和生成質量。這對於需要處理超長文檔、複雜代碼庫或進行多步驟自主代理任務的場景至關重要。
在技術架構上,智譜團隊提出了名為IndexShare的創新方法。該機制在每四個稀疏注意力層之間複用同一個索引器,從而在百萬token的上下文長度下,將每token所需的浮點運算次數大幅削減了2.9倍。同時,GLM-5.2改進了其多token預測層,使得在推測解碼過程中的接受長度提升了最高20%,這直接轉化為更快的生成速度和更低的推理延遲。模型還引入了靈活的思考努力程度設置,允許用戶在編碼等任務中根據需求平衡性能與響應速度。
從基準測試成績來看,GLM-5.2展現出了全面的競爭力。在衡量高難度推理能力的HLE測試中,其得分從GLM-5.1的31分躍升至40.5分,若藉助工具更可達54.7分。在數學推理方面,AIME 2026得分高達99.2,HMMT 2026年2月賽題也取得了92.5分的成績。編碼能力是本次升級的另一大亮點:在SWE-bench Pro上得分62.1,在極具挑戰性的FrontierSWE基準中,其主導性得分從上一代的30.5飆升至74.4,顯示出解決真實世界軟件工程問題的潛力。此外,在Terminal Bench 2.1和MCP-Atlas等代理與工具使用測試中,GLM-5.2也穩居前列。
對於開發者社區而言,GLM-5.2的發佈伴隨著完善的部署支持。模型已可藉助SGLang、vLLM、Transformers、KTransformers以及Unsloth等主流框架進行本地化部署,並提供了針對昇騰NPU平臺的推理方案。這種開箱即用的生態兼容性,結合其寬鬆的MIT許可,大幅降低了企業級應用和學術研究的准入門檻。
從產業視角觀察,GLM-5.2的推出進一步加劇了頭部大模型在長程任務與編碼智能體領域的競爭。其百萬token穩定上下文的實現,配合計算效率的顯著優化,意味著AI模型正從“能讀懂長文本”向“能在長週期任務中可靠工作”轉變。對於關注AI基礎設施與模型層投資的讀者而言,這種在保持高性能的同時降低單位計算成本的技術路徑,是評估模型商業落地潛力的關鍵指標。智譜此次以全開源姿態交付旗艦模型,也可能對當前閉源與開源陣營的商業模式博弈產生新的推力。