智谱GLM-5.2全量开放，编程能力跻身全球前三

六月的AI圈上演了一出充满戏剧性的“开放与封闭”之争。就在Anthropic因国家安全审查被迫关停其最强模型Fable 5和Mythos 5全球访问后不久，中国AI公司智谱选择在同一时间点——5点21分——宣布全量开放旗下最强模型GLM-5.2，并直言“前沿智能属于所有人”。这一时间上的巧合被外界解读为对封闭路线的直接回应，也在开发者社区引发了广泛讨论。

GLM-5.2此次最引人注目的突破在于编程能力。在汇集全球百万用户盲测的代码能力评估系统Code Arena上，该模型以1595分排名总榜第二，仅次于已不可用的Fable 5，在所有当前可访问的模型中位列第一。独立评测机构Artificial Analysis在其智能指数v4.1中给予GLM-5.2 51分的评定，将其置于GPT-5.5与Opus 4.8之间，这也是开源模型首次进入这一性能区间。在更考验工程能力的FrontierSWE长程编程基准上，GLM-5.2得分74.4，与Opus 4.8的75.1差距不到1个百分点，同时超越了GPT-5.5的72.6分。谷歌的Gemini则被挤出“御三家”之列，编程模型的第一阵营变为Claude、OpenAI和智谱三足鼎立。

除了单次输出的准确性，GLM-5.2在长时间任务中的可靠性成为另一个关键升级。该模型将上下文窗口扩展至1M token，相当于可以一次性容纳整个项目代码库、技术文档和需求说明，并在处理过程中保持记忆连贯。据智谱官方披露，有评测团队让GLM-5.2独立承接一个覆盖网页端、移动端和小程序的全栈应用开发任务，从开发、联调、测试到打包上线全程自主完成，累计处理超过88万tokens，几乎用满整个窗口，没有出现因上下文不足而“失忆”的情况。这使得AI编程从“会写一段代码”进化到“能完成一段工程”。

值得关注的是，GLM-5.2在参数规模远小于闭源竞品的情况下实现了性能追赶。该模型采用MoE架构，总参数744B，活跃参数约40B，而Opus 4.8和GPT-5.5的参数规模保守估计在1-2万亿区间。在AA-Omniscience基准测试中，GLM-5.2的幻觉率仅为28%，相比之下GPT-5.5高达86%，Opus 4.8为36%，Fable 5为48%。面对知识边界之外的问题，GLM-5.2更倾向于诚实承认不确定性，而非自信地生成错误答案。这表明更大的参数量和更长的推理时间并不必然带来更好的判断力。

成本方面，GLM-5.2的输入价格约1.40美元/百万token，输出约4.40美元/百万token，比Opus 4.8便宜约72%至82%。尽管相比前代GLM-5.1有所提价，但摩根大通在研报中指出，性能提升主要来自强化学习和后训练优化，而非大规模增加参数量，客户愿意为“完成任务”而非“消耗token”付费。

GLM-5.2以MIT协议完全开源，模型权重可自由下载、部署和商用，上线首日即完成与华为昇腾、平头哥、摩尔线程、寒武纪等8大国产算力平台的全适配。这意味着开发者可以在自有基础设施上运行该模型，无需担忧访问权限被突然切断。在Anthropic因监管压力筑起高墙的时刻，智谱选择铺路开放，市场也给出了积极回应——智谱在港股的市值此前已突破1万亿港元，年内涨幅超过1900%，成为中国首个万亿AI公司。

GLM-5.2并非没有短板。它在最高难度的SWE-Marathon基准上得分13.0，与Opus 4.8的26.0仍有差距，且不具备多模态能力，推理速度也受限于算力基础设施。但这些差距正在快速缩小。正如智谱在公告结尾所写：“向前沿智能再近一步，为每一个人。AI的未来是开放的，它属于所有人。”在2026年6月这个节点，AI编程的权力正在从少数闭源巨头向全球开发者终端转移，而中国开源模型已在这场转移中占据了关键席位。

智谱GLM-5.2全量开放，编程能力跻身全球前三

延伸阅读

相关深度报道

相关每日新闻