Claude Mythos 成導火索：梁文鋒決定讓 DeepSeek 融資

梁文鋒看到Claude Mythos能力後啟動融資，DeepSeek計劃將300人團隊翻倍並加速適配華為芯片。

據 The Information 最新披露，DeepSeek 創始人 梁文鋒 決定開啟融資的直接導火索，是目睹了競爭對手 Anthropic 旗下模型 Claude Mythos 的強悍表現。消息指出，梁文鋒看到 Claude Mythos 通過投入海量算力與數據訓練出的超強能力後，意識到 DeepSeek 如果不迅速儲備“彈藥”，將難以在下一階段的競爭中立足。

時間線的高度吻合為這一說法提供了佐證。Anthropic 於今年 4 月 發佈了 Claude Mythos 的第一個預覽版，而關於 DeepSeek 尋求融資的傳聞，恰好在 4 月中旬 首次在市場間流傳。

融資完成後，DeepSeek 迅速轉入擴張軌道。本週四，這家一向低調的公司罕見地發表公開聲明，宣佈所有部門招聘規模 “至少翻倍” ，崗位覆蓋 AI 系統開發、基礎設施、產品開發以及深度學習研究 等核心領域。目前 DeepSeek 全公司約有 300 人，這意味著團隊規模將迎來急劇膨脹。

擴張的緊迫性在關鍵部門已顯露無遺。負責將模型轉化為自主 AI 智能體的核心團隊 Harness，已進入每日高頻面試的節奏。該團隊負責人 崔天一 於今年 3 月 從量化交易巨頭 Jane Street 跳槽加入，並於本月早些時候在社交平臺 X 上透露了這一招聘狀態。

在人才擴張之外，DeepSeek 正將大量資源傾注於一項艱鉅的基礎工程：適配國產芯片。梁文鋒堅信華為的芯片能力在幾年內就能追上 英偉達 的水平，DeepSeek 理應率先完成適配。據悉，華為直到去年才得知 DeepSeek 已在私下試驗其芯片，隨後雙方開啟了直接合作。

然而，適配的代價不容小覷。DeepSeek 現有的訓練與部署系統完全圍繞英偉達 CUDA 軟件生態搭建，工程師們必須重寫底層軟件，才能使模型在華為芯片上高效運行。這一技術換軌直接導致 DeepSeek 長達 15 個月 沒有發佈任何新一代模型。在其他頂級實驗室每兩三個月就推出一款新模型的節奏下，這段空窗期顯得格外漫長，也使 DeepSeek 錯過了去年下半年由 Anthropic Claude Code 掀起的編程工具熱潮。

面對投資人的疑慮，梁文鋒在路演中給出了自己的判斷。他認為，編程工具和 AI 聊天機器人都只是 AI 進化過程中的臨時產物，若重注押在這些短期產品上，反而會偏離通往 AGI 的終極目標。這種對長期路線的堅持，也體現在他個人的資金承諾上。在此次總額 74 億美元 的融資中，梁文鋒自己寫下了最大的一張支票，出資 200 億人民幣（約 30 億美元），佔總額的五分之二。

融資完成後，DeepSeek 設立了員工持股計劃，並按實際估值分配股份。梁文鋒向身邊人強調，其戰略不會改變：繼續開源、保持低價、專注 AGI。他將 AGI 定義為機器在理解、推理、學習、規劃和適應等廣泛任務上達到人類水平。他還表示，“AI 不應該被少數人控制”。DeepSeek 是目前唯一一家將所有模型底層代碼完全公開的主要 AI 實驗室。

在美國開發者群體中，DeepSeek 的存在感正在急速膨脹。今年 4 月 發佈的旗艦模型 V4，於 5 月 在 Vercel 的 AI Gateway 平臺上，其 token 用量份額從不到 1% 飆升至 17%，一個月內便成為該平臺僅次於 Anthropic 和 Google 的第三大模型。其輕量版 V4 Flash 的價格，比 Anthropic 的模型便宜 20 到 50 倍，這種增長勢頭在 6 月仍在延續。

Claude Mythos 成導火索：梁文鋒決定讓 DeepSeek 融資

延伸閱讀

相關深度報道

相關每日新聞