智谱发布GLM-5.2：首次实现百万token稳定长程任务

智谱推出753B参数的GLM-5.2模型，长程任务性能较前代大幅提升。

智谱AI近日通过Hugging Face平台正式发布了其最新旗舰大语言模型GLM-5.2。这款参数规模高达753B的模型，以MIT开源许可证全面开放，无地域限制，标志着智谱在长程任务处理能力上迈出了关键一步。

GLM-5.2的核心突破在于其首次实现了对百万token上下文窗口的稳定支持。与上一代GLM-5.1相比，新模型不再仅仅是在理论上支持长上下文，而是能够在长达百万token的连续任务中保持稳定的推理和生成质量。这对于需要处理超长文档、复杂代码库或进行多步骤自主代理任务的场景至关重要。

在技术架构上，智谱团队提出了名为IndexShare的创新方法。该机制在每四个稀疏注意力层之间复用同一个索引器，从而在百万token的上下文长度下，将每token所需的浮点运算次数大幅削减了2.9倍。同时，GLM-5.2改进了其多token预测层，使得在推测解码过程中的接受长度提升了最高20%，这直接转化为更快的生成速度和更低的推理延迟。模型还引入了灵活的思考努力程度设置，允许用户在编码等任务中根据需求平衡性能与响应速度。

从基准测试成绩来看，GLM-5.2展现出了全面的竞争力。在衡量高难度推理能力的HLE测试中，其得分从GLM-5.1的31分跃升至40.5分，若借助工具更可达54.7分。在数学推理方面，AIME 2026得分高达99.2，HMMT 2026年2月赛题也取得了92.5分的成绩。编码能力是本次升级的另一大亮点：在SWE-bench Pro上得分62.1，在极具挑战性的FrontierSWE基准中，其主导性得分从上一代的30.5飙升至74.4，显示出解决真实世界软件工程问题的潜力。此外，在Terminal Bench 2.1和MCP-Atlas等代理与工具使用测试中，GLM-5.2也稳居前列。

对于开发者社区而言，GLM-5.2的发布伴随着完善的部署支持。模型已可借助SGLang、vLLM、Transformers、KTransformers以及Unsloth等主流框架进行本地化部署，并提供了针对昇腾NPU平台的推理方案。这种开箱即用的生态兼容性，结合其宽松的MIT许可，大幅降低了企业级应用和学术研究的准入门槛。

从产业视角观察，GLM-5.2的推出进一步加剧了头部大模型在长程任务与编码智能体领域的竞争。其百万token稳定上下文的实现，配合计算效率的显著优化，意味着AI模型正从“能读懂长文本”向“能在长周期任务中可靠工作”转变。对于关注AI基础设施与模型层投资的读者而言，这种在保持高性能的同时降低单位计算成本的技术路径，是评估模型商业落地潜力的关键指标。智谱此次以全开源姿态交付旗舰模型，也可能对当前闭源与开源阵营的商业模式博弈产生新的推力。

智谱发布GLM-5.2：首次实现百万token稳定长程任务

延伸阅读

相关深度报道

相关每日新闻