中国 Z.ai 开源模型 GLM-5.2 登顶多项 AI 排行榜，全华为芯片训练

Z.ai的GLM-5.2模型在Fable禁令一周内，凭借华为芯片支持跃居开源AI排行榜首位。

美国商务部一纸出口管制令，意外将一家中国 AI 公司的开源模型推上了全球排行榜的顶端。6 月 12 日，美国商务部要求 Anthropic 停止向所有外国用户提供 Fable 5 和 Mythos 5 模型，迫使该公司在全球范围内关闭这两款模型的访问。次日，北京 Z.ai（原智谱 AI）开始推出其开源模型 GLM-5.2，并以宽松的 MIT 许可证 发布权重。短短一周内，该模型便登顶多个公开可用模型的排行榜，Z.ai 的市值也随之突破 1 万亿港元（约合 1280 亿美元）。

GLM-5.2 最引人注目的并非其性能本身，而是其训练堆栈。Z.ai 声称，该模型完全在约 10 万颗华为昇腾 910B 芯片上，使用 MindSpore 框架训练而成，全程未使用任何英伟达硬件。Z.ai 自 2025 年 1 月起就被列入美国实体清单，无法获取英伟达的 H100、H200 和 B200 加速器。这一成绩直接挑战了美国对华先进 AI 芯片出口管制的有效性——这些管制原本旨在阻止中国开发出此类前沿模型。

在具体性能上，GLM-5.2 的表现强劲但不均衡。它在 Design Arena 的人类偏好编码排行榜上夺得第一，领先 Fable 5 约 10 个 Elo 分；在 Artificial Analysis 的 Intelligence Index v4.1 上，它以 51 分 的成绩位列公开可用模型之首，超越了 MiniMax-M3、DeepSeek V4 Pro 和谷歌的 Gemini 3.1 Pro Preview。在 SWE-bench Pro 测试中，它取得了 62.1 分，高于 GPT-5.5 的 58.6 分。但在更长周期的工作任务上，情况有所不同：在 Code Arena 的前端开发排行榜上，GLM-5.2 位居 Fable 5 之后；在模拟多周知识整合任务的 AA-Briefcase 测试中，Fable 5 以 1587 Elo 领先，Opus 4.8 以 1356 Elo 紧随其后，GLM-5.2 以 1266 Elo 排在第三。在终端操作基准 Terminal-Bench 2.1 上，GLM-5.2 得分 81.0，落后于 Opus 4.8 的 85.0 和 GPT-5.5 的 84.0，但领先于 Gemini 3.1 Pro 的 74.0。

GLM-5.2 之所以能占据当前可访问模型的榜首位置，部分原因在于其最强劲的竞争对手 Fable 5 已被关停。Anthropic 在 6 月 10 日向公众发布了 Fable 5——这是其 Mythos 5 模型的一个安全受限版本，旨在屏蔽底层系统的网络和生物能力。仅两天后，美国商务部突然以存在绕过安全防护的技术为由，下令禁止向所有外国用户提供访问权限，甚至包括 Anthropic 自己的非美国籍员工。Anthropic 随后声明称，相关越狱技术范围狭窄，仅暴露了此前已知的次要漏洞，且产生的行为在其他公开模型（包括 OpenAI 的 GPT-5.5）上也能复现，认为禁令基于“误解”，正在努力恢复访问。但由于禁令覆盖所有外国用户，Anthropic 无法单独为美国用户保留模型，只能对所有人关闭。

GLM-5.2 的 MIT 许可证允许任何人下载、微调和自行托管其权重，但其运行门槛不低。该模型拥有约 7440 亿 总参数，每个 token 激活 400 亿 参数，上下文窗口达 100 万 token，需要企业级 GPU 集群或高内存工作站才能运行，并非桌面级应用。最实际的使用方式是通过 API，Z.ai 的定价约为每百万输入 token 1.40 美元、每百万输出 token 4.40 美元，相比之下，Claude Opus 4.8 为 5 美元和 25 美元，Fable 5 为 10 美元和 50 美元。在 AA-Briefcase 任务中，Fable 5 平均每任务成本 31 美元，而 GLM-5.2 仅为 2.40 美元，成本差距约 13 倍。

资本市场对此反应迅速。Z.ai 在香港上市的主体 Knowledge Atlas Technology，股价在 6 月 22 日盘中一度飙升 42% 至 2980 港元，推动市值突破 1 万亿港元。创始人唐杰曾公开表示，中国模型追平 Fable 5 的时间将早于马斯克最近预测的明年第一季度。不过，一个更近的考验即将到来：7 月 8 日，Z.ai 首批基石投资者的锁定期将到期，大量股票将解禁流通，这将为 GLM-5.2 引发的这轮上涨带来第一次真正的压力测试。

从产业角度看，GLM-5.2 的成功证明了前沿开源模型可以在完全国产化的芯片堆栈上诞生，但这并不意味着华为芯片已经追平英伟达。美国外交关系委员会去年 12 月的报告显示，华为 昇腾 910C 的推理性能约为英伟达 H100 的 60%，在效率和集群规模上仍有较大差距；同一报告预测，最早明年美国最先进芯片的性能可能达到华为顶级芯片的 17 倍 以上。模型性能的持平不等于硬件性能的持平，但 GLM-5.2 的出现无疑表明，在软件和系统工程的层面，中国公司正在找到绕过硬件限制的路径。

中国 Z.ai 开源模型 GLM-5.2 登顶多项 AI 排行榜，全华为芯片训练

延伸阅读

相关深度报道

相关每日新闻