中國 Z.ai 開源模型 GLM-5.2 登頂多項 AI 排行榜，全華為芯片訓練

Z.ai的GLM-5.2模型在Fable禁令一週內，憑藉華為芯片支持躍居開源AI排行榜首位。

美國商務部一紙出口管制令，意外將一家中國 AI 公司的開源模型推上了全球排行榜的頂端。6 月 12 日，美國商務部要求 Anthropic 停止向所有外國用戶提供 Fable 5 和 Mythos 5 模型，迫使該公司在全球範圍內關閉這兩款模型的訪問。次日，北京 Z.ai（原智譜 AI）開始推出其開源模型 GLM-5.2，並以寬鬆的 MIT 許可證 發佈權重。短短一週內，該模型便登頂多個公開可用模型的排行榜，Z.ai 的市值也隨之突破 1 萬億港元（約合 1280 億美元）。

GLM-5.2 最引人注目的並非其性能本身，而是其訓練堆棧。Z.ai 聲稱，該模型完全在約 10 萬顆華為昇騰 910B 芯片上，使用 MindSpore 框架訓練而成，全程未使用任何英偉達硬件。Z.ai 自 2025 年 1 月起就被列入美國實體清單，無法獲取英偉達的 H100、H200 和 B200 加速器。這一成績直接挑戰了美國對華先進 AI 芯片出口管制的有效性——這些管制原本旨在阻止中國開發出此類前沿模型。

在具體性能上，GLM-5.2 的表現強勁但不均衡。它在 Design Arena 的人類偏好編碼排行榜上奪得第一，領先 Fable 5 約 10 個 Elo 分；在 Artificial Analysis 的 Intelligence Index v4.1 上，它以 51 分 的成績位列公開可用模型之首，超越了 MiniMax-M3、DeepSeek V4 Pro 和谷歌的 Gemini 3.1 Pro Preview。在 SWE-bench Pro 測試中，它取得了 62.1 分，高於 GPT-5.5 的 58.6 分。但在更長週期的工作任務上，情況有所不同：在 Code Arena 的前端開發排行榜上，GLM-5.2 位居 Fable 5 之後；在模擬多周知識整合任務的 AA-Briefcase 測試中，Fable 5 以 1587 Elo 領先，Opus 4.8 以 1356 Elo 緊隨其後，GLM-5.2 以 1266 Elo 排在第三。在終端操作基準 Terminal-Bench 2.1 上，GLM-5.2 得分 81.0，落後於 Opus 4.8 的 85.0 和 GPT-5.5 的 84.0，但領先於 Gemini 3.1 Pro 的 74.0。

GLM-5.2 之所以能佔據當前可訪問模型的榜首位置，部分原因在於其最強勁的競爭對手 Fable 5 已被關停。Anthropic 在 6 月 10 日向公眾發佈了 Fable 5——這是其 Mythos 5 模型的一個安全受限版本，旨在屏蔽底層系統的網絡和生物能力。僅兩天後，美國商務部突然以存在繞過安全防護的技術為由，下令禁止向所有外國用戶提供訪問權限，甚至包括 Anthropic 自己的非美國籍員工。Anthropic 隨後聲明稱，相關越獄技術範圍狹窄，僅暴露了此前已知的次要漏洞，且產生的行為在其他公開模型（包括 OpenAI 的 GPT-5.5）上也能復現，認為禁令基於“誤解”，正在努力恢復訪問。但由於禁令覆蓋所有外國用戶，Anthropic 無法單獨為美國用戶保留模型，只能對所有人關閉。

GLM-5.2 的 MIT 許可證允許任何人下載、微調和自行託管其權重，但其運行門檻不低。該模型擁有約 7440 億 總參數，每個 token 激活 400 億 參數，上下文窗口達 100 萬 token，需要企業級 GPU 集群或高內存工作站才能運行，並非桌面級應用。最實際的使用方式是通過 API，Z.ai 的定價約為每百萬輸入 token 1.40 美元、每百萬輸出 token 4.40 美元，相比之下，Claude Opus 4.8 為 5 美元和 25 美元，Fable 5 為 10 美元和 50 美元。在 AA-Briefcase 任務中，Fable 5 平均每任務成本 31 美元，而 GLM-5.2 僅為 2.40 美元，成本差距約 13 倍。

資本市場對此反應迅速。Z.ai 在香港上市的主體 Knowledge Atlas Technology，股價在 6 月 22 日盤中一度飆升 42% 至 2980 港元，推動市值突破 1 萬億港元。創始人唐傑曾公開表示，中國模型追平 Fable 5 的時間將早於馬斯克最近預測的明年第一季度。不過，一個更近的考驗即將到來：7 月 8 日，Z.ai 首批基石投資者的鎖定期將到期，大量股票將解禁流通，這將為 GLM-5.2 引發的這輪上漲帶來第一次真正的壓力測試。

從產業角度看，GLM-5.2 的成功證明了前沿開源模型可以在完全國產化的芯片堆棧上誕生，但這並不意味著華為芯片已經追平英偉達。美國外交關係委員會去年 12 月的報告顯示，華為 昇騰 910C 的推理性能約為英偉達 H100 的 60%，在效率和集群規模上仍有較大差距；同一報告預測，最早明年美國最先進芯片的性能可能達到華為頂級芯片的 17 倍 以上。模型性能的持平不等於硬件性能的持平，但 GLM-5.2 的出現無疑表明，在軟件和系統工程的層面，中國公司正在找到繞過硬件限制的路徑。

中國 Z.ai 開源模型 GLM-5.2 登頂多項 AI 排行榜，全華為芯片訓練

延伸閱讀

相關深度報道

相關每日新聞