美國商務部一紙出口管制令,意外將一家中國 AI 公司的開源模型推上了全球排行榜的頂端。6 月 12 日,美國商務部要求 Anthropic 停止向所有外國用戶提供 Fable 5Mythos 5 模型,迫使該公司在全球範圍內關閉這兩款模型的訪問。次日,北京 Z.ai(原智譜 AI)開始推出其開源模型 GLM-5.2,並以寬鬆的 MIT 許可證 發佈權重。短短一週內,該模型便登頂多個公開可用模型的排行榜,Z.ai 的市值也隨之突破 1 萬億港元(約合 1280 億美元)。

GLM-5.2 最引人注目的並非其性能本身,而是其訓練堆棧。Z.ai 聲稱,該模型完全在約 10 萬顆華為昇騰 910B 芯片上,使用 MindSpore 框架訓練而成,全程未使用任何英偉達硬件。Z.ai 自 2025 年 1 月起就被列入美國實體清單,無法獲取英偉達的 H100H200B200 加速器。這一成績直接挑戰了美國對華先進 AI 芯片出口管制的有效性——這些管制原本旨在阻止中國開發出此類前沿模型。

在具體性能上,GLM-5.2 的表現強勁但不均衡。它在 Design Arena 的人類偏好編碼排行榜上奪得第一,領先 Fable 5 約 10 個 Elo 分;在 Artificial Analysis 的 Intelligence Index v4.1 上,它以 51 分 的成績位列公開可用模型之首,超越了 MiniMax-M3DeepSeek V4 Pro 和谷歌的 Gemini 3.1 Pro Preview。在 SWE-bench Pro 測試中,它取得了 62.1 分,高於 GPT-5.5 的 58.6 分。但在更長週期的工作任務上,情況有所不同:在 Code Arena 的前端開發排行榜上,GLM-5.2 位居 Fable 5 之後;在模擬多周知識整合任務的 AA-Briefcase 測試中,Fable 5 以 1587 Elo 領先,Opus 4.8 以 1356 Elo 緊隨其後,GLM-5.2 以 1266 Elo 排在第三。在終端操作基準 Terminal-Bench 2.1 上,GLM-5.2 得分 81.0,落後於 Opus 4.8 的 85.0 和 GPT-5.5 的 84.0,但領先於 Gemini 3.1 Pro 的 74.0。

GLM-5.2 之所以能佔據當前可訪問模型的榜首位置,部分原因在於其最強勁的競爭對手 Fable 5 已被關停。Anthropic 在 6 月 10 日向公眾發佈了 Fable 5——這是其 Mythos 5 模型的一個安全受限版本,旨在屏蔽底層系統的網絡和生物能力。僅兩天後,美國商務部突然以存在繞過安全防護的技術為由,下令禁止向所有外國用戶提供訪問權限,甚至包括 Anthropic 自己的非美國籍員工。Anthropic 隨後聲明稱,相關越獄技術範圍狹窄,僅暴露了此前已知的次要漏洞,且產生的行為在其他公開模型(包括 OpenAI 的 GPT-5.5)上也能復現,認為禁令基於“誤解”,正在努力恢復訪問。但由於禁令覆蓋所有外國用戶,Anthropic 無法單獨為美國用戶保留模型,只能對所有人關閉。

GLM-5.2 的 MIT 許可證允許任何人下載、微調和自行託管其權重,但其運行門檻不低。該模型擁有約 7440 億 總參數,每個 token 激活 400 億 參數,上下文窗口100 萬 token,需要企業級 GPU 集群或高內存工作站才能運行,並非桌面級應用。最實際的使用方式是通過 API,Z.ai 的定價約為每百萬輸入 token 1.40 美元、每百萬輸出 token 4.40 美元,相比之下,Claude Opus 4.8 為 5 美元和 25 美元,Fable 5 為 10 美元和 50 美元。在 AA-Briefcase 任務中,Fable 5 平均每任務成本 31 美元,而 GLM-5.2 僅為 2.40 美元,成本差距約 13 倍

資本市場對此反應迅速。Z.ai 在香港上市的主體 Knowledge Atlas Technology,股價在 6 月 22 日盤中一度飆升 42%2980 港元,推動市值突破 1 萬億港元。創始人 唐傑 曾公開表示,中國模型追平 Fable 5 的時間將早於馬斯克最近預測的明年第一季度。不過,一個更近的考驗即將到來:7 月 8 日,Z.ai 首批基石投資者的鎖定期將到期,大量股票將解禁流通,這將為 GLM-5.2 引發的這輪上漲帶來第一次真正的壓力測試。

從產業角度看,GLM-5.2 的成功證明了前沿開源模型可以在完全國產化的芯片堆棧上誕生,但這並不意味著華為芯片已經追平英偉達。美國外交關係委員會去年 12 月的報告顯示,華為 昇騰 910C 的推理性能約為英偉達 H100 的 60%,在效率和集群規模上仍有較大差距;同一報告預測,最早明年美國最先進芯片的性能可能達到華為頂級芯片的 17 倍 以上。模型性能的持平不等於硬件性能的持平,但 GLM-5.2 的出現無疑表明,在軟件和系統工程的層面,中國公司正在找到繞過硬件限制的路徑。