六月的AI圈上演了一出充满戏剧性的“开放与封闭”之争。就在Anthropic因国家安全审查被迫关停其最强模型Fable 5和Mythos 5全球访问后不久,中国AI公司智谱选择在同一时间点——5点21分——宣布全量开放旗下最强模型GLM-5.2,并直言“前沿智能属于所有人”。这一时间上的巧合被外界解读为对封闭路线的直接回应,也在开发者社区引发了广泛讨论。

GLM-5.2此次最引人注目的突破在于编程能力。在汇集全球百万用户盲测的代码能力评估系统Code Arena上,该模型以1595分排名总榜第二,仅次于已不可用的Fable 5,在所有当前可访问的模型中位列第一。独立评测机构Artificial Analysis在其智能指数v4.1中给予GLM-5.2 51分的评定,将其置于GPT-5.5Opus 4.8之间,这也是开源模型首次进入这一性能区间。在更考验工程能力的FrontierSWE长程编程基准上,GLM-5.2得分74.4,与Opus 4.8的75.1差距不到1个百分点,同时超越了GPT-5.5的72.6分。谷歌的Gemini则被挤出“御三家”之列,编程模型的第一阵营变为Claude、OpenAI和智谱三足鼎立。

除了单次输出的准确性,GLM-5.2在长时间任务中的可靠性成为另一个关键升级。该模型将上下文窗口扩展至1M token,相当于可以一次性容纳整个项目代码库、技术文档和需求说明,并在处理过程中保持记忆连贯。据智谱官方披露,有评测团队让GLM-5.2独立承接一个覆盖网页端、移动端和小程序的全栈应用开发任务,从开发、联调、测试到打包上线全程自主完成,累计处理超过88万tokens,几乎用满整个窗口,没有出现因上下文不足而“失忆”的情况。这使得AI编程从“会写一段代码”进化到“能完成一段工程”。

值得关注的是,GLM-5.2在参数规模远小于闭源竞品的情况下实现了性能追赶。该模型采用MoE架构,总参数744B,活跃参数约40B,而Opus 4.8和GPT-5.5的参数规模保守估计在1-2万亿区间。在AA-Omniscience基准测试中,GLM-5.2的幻觉率仅为28%,相比之下GPT-5.5高达86%,Opus 4.8为36%,Fable 5为48%。面对知识边界之外的问题,GLM-5.2更倾向于诚实承认不确定性,而非自信地生成错误答案。这表明更大的参数量和更长的推理时间并不必然带来更好的判断力。

成本方面,GLM-5.2的输入价格约1.40美元/百万token,输出约4.40美元/百万token,比Opus 4.8便宜约72%至82%。尽管相比前代GLM-5.1有所提价,但摩根大通在研报中指出,性能提升主要来自强化学习和后训练优化,而非大规模增加参数量,客户愿意为“完成任务”而非“消耗token”付费。

GLM-5.2以MIT协议完全开源,模型权重可自由下载、部署和商用,上线首日即完成与华为昇腾平头哥摩尔线程寒武纪等8大国产算力平台的全适配。这意味着开发者可以在自有基础设施上运行该模型,无需担忧访问权限被突然切断。在Anthropic因监管压力筑起高墙的时刻,智谱选择铺路开放,市场也给出了积极回应——智谱在港股的市值此前已突破1万亿港元,年内涨幅超过1900%,成为中国首个万亿AI公司。

GLM-5.2并非没有短板。它在最高难度的SWE-Marathon基准上得分13.0,与Opus 4.8的26.0仍有差距,且不具备多模态能力,推理速度也受限于算力基础设施。但这些差距正在快速缩小。正如智谱在公告结尾所写:“向前沿智能再近一步,为每一个人。AI的未来是开放的,它属于所有人。”在2026年6月这个节点,AI编程的权力正在从少数闭源巨头向全球开发者终端转移,而中国开源模型已在这场转移中占据了关键席位。