Anthropic 安全測試名單曝光：Kimi K2.7 躋身八強

Anthropic在Fable 5上線時公佈8款模型安全測試名單，Kimi K2.7是唯一入選的中國模型。

Anthropic 在發佈 Claude Fable 5 的同時，用一份內部安全測試名單回應了外界對模型潛在風險的爭議。這份名單披露，在要求極為嚴苛的“能復現出相同演示”測試中，共有 八款模型 達標，其中包括 GPT-5.5、Anthropic 自家的 Opus 4.8，以及來自中國月之暗面的 Kimi K2.7。

八強席位中，Claude 系列佔據五席，GPT 系列佔據兩席，Kimi K2.7 是唯一一款非美國公司開發的模型。Anthropic 的邏輯很直接：通過證明其他頂級模型同樣能識別出相關漏洞，來表明 Fable 5 的安全表現並非孤例，從而淡化其風險爭議。但客觀上，這份名單將 Kimi K2.7 與 GPT-5.5、Fable 5 放在了同一能力段位上，相當於給中國大模型的底層實力做了一次“官方蓋章”。

這份技術認證並非孤立事件。北美科技公司正在用實際部署“用腳投票”。Coinbase 首席執行官 Brian Armstrong 近期公開了公司內部的 AI 降本策略：通過內部 LLM 網關，將 Kimi K2.7 和 GLM 5.2 設為工程師的默認模型。理由很務實——91% 的員工從未觸及使用上限，與其削減額度，不如直接切換到更具性價比的模型。配合按任務自動路由、將緩存命中率從 5% 提升至 60%，Coinbase 的 AI 賬單直接削減了近一半。一家美國上市金融企業把中國開源模型設為生產環境默認選項，這在一年前幾乎不可想象，標誌著中國模型在海外的認知正從“低價替代”轉向“可被嚴肅採用的技術供給”。

在 AI 編程工具賽道，Cursor 的經歷同樣說明問題。這家公司曾因 Claude Code 的衝擊而承壓，隨後以 Kimi K2.5 為基座進行後訓練，重新拉起了產品能力。其 Composer 模型的底層 model ID 直接指向 kimi-k2.5，連 馬斯克 都在 X 上確認了這一事實。轉折點出現在 6 月 16 日，SpaceX 宣佈以約 600 億美元 全股票收購 Cursor，消息公佈當天 SpaceX 盤中股價一度飆升約 16%，總市值短暫超越亞馬遜和微軟。一家把 Kimi 當基座的應用公司，就此被定價到 600 億美元。

Kimi 的合作伙伴 Fireworks 則講述了另一個版本的故事。這家推理平臺在大約七個月內，估值從 40 億美元 一路攀升到 150 億美元，客戶名單包括 Cursor、Perplexity、Notion、Uber 等。在 OpenCode 的開源模型排名中，按 cost/session 計算，前三名分別是 GLM、Kimi、DeepSeek。從千億美國巨頭到 AI 編程獨角獸，北美 AI 公司正在自己的生產基礎設施裡給中國開源模型留出默認位置。

外部認證與採用之外，Kimi 自身的商業模式曲線也值得關注。據披露，其年度經常性收入在過去幾個月走出陡峭上升線：三個月 ARR 翻三倍，海外用戶增長 400%。增長動力並非來自定製化項目或龐大的直銷團隊，而是模型能力迭代帶來的開發者自發採用和 API 收入增長——這是一種典型的“產品主導增長”模式。目前 Kimi 員工總數僅約 300 人，API 收入約佔總收入的 70%，客戶覆蓋據稱已達 200 多個國家和地區，海外收入佔比接近一半。

這套增長邏輯與早期的 Anthropic 高度相似。Anthropic 在 ARR 衝向 10 億美元的過程中，同樣沒有急於組建大規模直銷軍團，而是押注開發者自助採用。據公開信息，Kimi 投前估值約 315 億美元，僅相當於 Anthropic 最新估值的 3%，也低於智譜在港股的最新市場估值。當收入結構、增長曲線、增長邏輯都在向 Anthropic 靠攏，而估值仍差著一個數量級，這中間的差距本身就構成了市場關注的敘事空間。

放眼全球，能拿出萬億參數開源模型的廠商屈指可數。從 2023 年到 2026 年，大模型賽道經歷了一輪又一輪的殘酷出清。當潮水退去，同時具備持續投入、模型迭代、商業造血和生態影響力四大能力的中國玩家已所剩無幾。Anthropic 那份八款模型的名單，或許已經給出了它對“誰是第二”的判斷。

Anthropic 安全測試名單曝光：Kimi K2.7 躋身八強

延伸閱讀

相關深度報道

相關每日新聞