Anthropic 在發佈 Claude Fable 5 的同時,用一份內部安全測試名單回應了外界對模型潛在風險的爭議。這份名單披露,在要求極為嚴苛的“能復現出相同演示”測試中,共有 八款模型 達標,其中包括 GPT-5.5、Anthropic 自家的 Opus 4.8,以及來自中國月之暗面的 Kimi K2.7。
八強席位中,Claude 系列佔據五席,GPT 系列佔據兩席,Kimi K2.7 是唯一一款非美國公司開發的模型。Anthropic 的邏輯很直接:通過證明其他頂級模型同樣能識別出相關漏洞,來表明 Fable 5 的安全表現並非孤例,從而淡化其風險爭議。但客觀上,這份名單將 Kimi K2.7 與 GPT-5.5、Fable 5 放在了同一能力段位上,相當於給中國大模型的底層實力做了一次“官方蓋章”。
這份技術認證並非孤立事件。北美科技公司正在用實際部署“用腳投票”。Coinbase 首席執行官 Brian Armstrong 近期公開了公司內部的 AI 降本策略:通過內部 LLM 網關,將 Kimi K2.7 和 GLM 5.2 設為工程師的默認模型。理由很務實——91% 的員工從未觸及使用上限,與其削減額度,不如直接切換到更具性價比的模型。配合按任務自動路由、將緩存命中率從 5% 提升至 60%,Coinbase 的 AI 賬單直接削減了近一半。一家美國上市金融企業把中國開源模型設為生產環境默認選項,這在一年前幾乎不可想象,標誌著中國模型在海外的認知正從“低價替代”轉向“可被嚴肅採用的技術供給”。
在 AI 編程工具賽道,Cursor 的經歷同樣說明問題。這家公司曾因 Claude Code 的衝擊而承壓,隨後以 Kimi K2.5 為基座進行後訓練,重新拉起了產品能力。其 Composer 模型的底層 model ID 直接指向 kimi-k2.5,連 馬斯克 都在 X 上確認了這一事實。轉折點出現在 6 月 16 日,SpaceX 宣佈以約 600 億美元 全股票收購 Cursor,消息公佈當天 SpaceX 盤中股價一度飆升約 16%,總市值短暫超越亞馬遜和微軟。一家把 Kimi 當基座的應用公司,就此被定價到 600 億美元。
Kimi 的合作伙伴 Fireworks 則講述了另一個版本的故事。這家推理平臺在大約七個月內,估值從 40 億美元 一路攀升到 150 億美元,客戶名單包括 Cursor、Perplexity、Notion、Uber 等。在 OpenCode 的開源模型排名中,按 cost/session 計算,前三名分別是 GLM、Kimi、DeepSeek。從千億美國巨頭到 AI 編程獨角獸,北美 AI 公司正在自己的生產基礎設施裡給中國開源模型留出默認位置。
外部認證與採用之外,Kimi 自身的商業模式曲線也值得關注。據披露,其年度經常性收入在過去幾個月走出陡峭上升線:三個月 ARR 翻三倍,海外用戶增長 400%。增長動力並非來自定製化項目或龐大的直銷團隊,而是模型能力迭代帶來的開發者自發採用和 API 收入增長——這是一種典型的“產品主導增長”模式。目前 Kimi 員工總數僅約 300 人,API 收入約佔總收入的 70%,客戶覆蓋據稱已達 200 多個國家和地區,海外收入佔比接近一半。
這套增長邏輯與早期的 Anthropic 高度相似。Anthropic 在 ARR 衝向 10 億美元的過程中,同樣沒有急於組建大規模直銷軍團,而是押注開發者自助採用。據公開信息,Kimi 投前估值約 315 億美元,僅相當於 Anthropic 最新估值的 3%,也低於智譜在港股的最新市場估值。當收入結構、增長曲線、增長邏輯都在向 Anthropic 靠攏,而估值仍差著一個數量級,這中間的差距本身就構成了市場關注的敘事空間。
放眼全球,能拿出萬億參數開源模型的廠商屈指可數。從 2023 年到 2026 年,大模型賽道經歷了一輪又一輪的殘酷出清。當潮水退去,同時具備持續投入、模型迭代、商業造血和生態影響力四大能力的中國玩家已所剩無幾。Anthropic 那份八款模型的名單,或許已經給出了它對“誰是第二”的判斷。