美国商务部一纸出口管制令,意外将一家中国 AI 公司的开源模型推上了全球排行榜的顶端。6 月 12 日,美国商务部要求 Anthropic 停止向所有外国用户提供 Fable 5 和 Mythos 5 模型,迫使该公司在全球范围内关闭这两款模型的访问。次日,北京 Z.ai(原智谱 AI)开始推出其开源模型 GLM-5.2,并以宽松的 MIT 许可证 发布权重。短短一周内,该模型便登顶多个公开可用模型的排行榜,Z.ai 的市值也随之突破 1 万亿港元(约合 1280 亿美元)。
GLM-5.2 最引人注目的并非其性能本身,而是其训练堆栈。Z.ai 声称,该模型完全在约 10 万颗华为昇腾 910B 芯片上,使用 MindSpore 框架训练而成,全程未使用任何英伟达硬件。Z.ai 自 2025 年 1 月起就被列入美国实体清单,无法获取英伟达的 H100、H200 和 B200 加速器。这一成绩直接挑战了美国对华先进 AI 芯片出口管制的有效性——这些管制原本旨在阻止中国开发出此类前沿模型。
在具体性能上,GLM-5.2 的表现强劲但不均衡。它在 Design Arena 的人类偏好编码排行榜上夺得第一,领先 Fable 5 约 10 个 Elo 分;在 Artificial Analysis 的 Intelligence Index v4.1 上,它以 51 分 的成绩位列公开可用模型之首,超越了 MiniMax-M3、DeepSeek V4 Pro 和谷歌的 Gemini 3.1 Pro Preview。在 SWE-bench Pro 测试中,它取得了 62.1 分,高于 GPT-5.5 的 58.6 分。但在更长周期的工作任务上,情况有所不同:在 Code Arena 的前端开发排行榜上,GLM-5.2 位居 Fable 5 之后;在模拟多周知识整合任务的 AA-Briefcase 测试中,Fable 5 以 1587 Elo 领先,Opus 4.8 以 1356 Elo 紧随其后,GLM-5.2 以 1266 Elo 排在第三。在终端操作基准 Terminal-Bench 2.1 上,GLM-5.2 得分 81.0,落后于 Opus 4.8 的 85.0 和 GPT-5.5 的 84.0,但领先于 Gemini 3.1 Pro 的 74.0。
GLM-5.2 之所以能占据当前可访问模型的榜首位置,部分原因在于其最强劲的竞争对手 Fable 5 已被关停。Anthropic 在 6 月 10 日向公众发布了 Fable 5——这是其 Mythos 5 模型的一个安全受限版本,旨在屏蔽底层系统的网络和生物能力。仅两天后,美国商务部突然以存在绕过安全防护的技术为由,下令禁止向所有外国用户提供访问权限,甚至包括 Anthropic 自己的非美国籍员工。Anthropic 随后声明称,相关越狱技术范围狭窄,仅暴露了此前已知的次要漏洞,且产生的行为在其他公开模型(包括 OpenAI 的 GPT-5.5)上也能复现,认为禁令基于“误解”,正在努力恢复访问。但由于禁令覆盖所有外国用户,Anthropic 无法单独为美国用户保留模型,只能对所有人关闭。
GLM-5.2 的 MIT 许可证允许任何人下载、微调和自行托管其权重,但其运行门槛不低。该模型拥有约 7440 亿 总参数,每个 token 激活 400 亿 参数,上下文窗口达 100 万 token,需要企业级 GPU 集群或高内存工作站才能运行,并非桌面级应用。最实际的使用方式是通过 API,Z.ai 的定价约为每百万输入 token 1.40 美元、每百万输出 token 4.40 美元,相比之下,Claude Opus 4.8 为 5 美元和 25 美元,Fable 5 为 10 美元和 50 美元。在 AA-Briefcase 任务中,Fable 5 平均每任务成本 31 美元,而 GLM-5.2 仅为 2.40 美元,成本差距约 13 倍。
资本市场对此反应迅速。Z.ai 在香港上市的主体 Knowledge Atlas Technology,股价在 6 月 22 日盘中一度飙升 42% 至 2980 港元,推动市值突破 1 万亿港元。创始人 唐杰 曾公开表示,中国模型追平 Fable 5 的时间将早于马斯克最近预测的明年第一季度。不过,一个更近的考验即将到来:7 月 8 日,Z.ai 首批基石投资者的锁定期将到期,大量股票将解禁流通,这将为 GLM-5.2 引发的这轮上涨带来第一次真正的压力测试。
从产业角度看,GLM-5.2 的成功证明了前沿开源模型可以在完全国产化的芯片堆栈上诞生,但这并不意味着华为芯片已经追平英伟达。美国外交关系委员会去年 12 月的报告显示,华为 昇腾 910C 的推理性能约为英伟达 H100 的 60%,在效率和集群规模上仍有较大差距;同一报告预测,最早明年美国最先进芯片的性能可能达到华为顶级芯片的 17 倍 以上。模型性能的持平不等于硬件性能的持平,但 GLM-5.2 的出现无疑表明,在软件和系统工程的层面,中国公司正在找到绕过硬件限制的路径。