The Information 最新披露,DeepSeek 創始人 梁文鋒 決定開啟融資的直接導火索,是目睹了競爭對手 Anthropic 旗下模型 Claude Mythos 的強悍表現。消息指出,梁文鋒看到 Claude Mythos 通過投入海量算力與數據訓練出的超強能力後,意識到 DeepSeek 如果不迅速儲備“彈藥”,將難以在下一階段的競爭中立足。

時間線的高度吻合為這一說法提供了佐證。Anthropic 於今年 4 月 發佈了 Claude Mythos 的第一個預覽版,而關於 DeepSeek 尋求融資的傳聞,恰好在 4 月中旬 首次在市場間流傳。

融資完成後,DeepSeek 迅速轉入擴張軌道。本週四,這家一向低調的公司罕見地發表公開聲明,宣佈所有部門招聘規模 “至少翻倍” ,崗位覆蓋 AI 系統開發、基礎設施、產品開發以及深度學習研究 等核心領域。目前 DeepSeek 全公司約有 300 人,這意味著團隊規模將迎來急劇膨脹。

擴張的緊迫性在關鍵部門已顯露無遺。負責將模型轉化為自主 AI 智能體的核心團隊 Harness,已進入每日高頻面試的節奏。該團隊負責人 崔天一 於今年 3 月 從量化交易巨頭 Jane Street 跳槽加入,並於本月早些時候在社交平臺 X 上透露了這一招聘狀態。

在人才擴張之外,DeepSeek 正將大量資源傾注於一項艱鉅的基礎工程:適配國產芯片。梁文鋒堅信 華為 的芯片能力在幾年內就能追上 英偉達 的水平,DeepSeek 理應率先完成適配。據悉,華為直到去年才得知 DeepSeek 已在私下試驗其芯片,隨後雙方開啟了直接合作。

然而,適配的代價不容小覷。DeepSeek 現有的訓練與部署系統完全圍繞英偉達 CUDA 軟件生態搭建,工程師們必須重寫底層軟件,才能使模型在華為芯片上高效運行。這一技術換軌直接導致 DeepSeek 長達 15 個月 沒有發佈任何新一代模型。在其他頂級實驗室每兩三個月就推出一款新模型的節奏下,這段空窗期顯得格外漫長,也使 DeepSeek 錯過了去年下半年由 Anthropic Claude Code 掀起的編程工具熱潮。

面對投資人的疑慮,梁文鋒在路演中給出了自己的判斷。他認為,編程工具和 AI 聊天機器人都只是 AI 進化過程中的臨時產物,若重注押在這些短期產品上,反而會偏離通往 AGI 的終極目標。這種對長期路線的堅持,也體現在他個人的資金承諾上。在此次總額 74 億美元 的融資中,梁文鋒自己寫下了最大的一張支票,出資 200 億人民幣(約 30 億美元),佔總額的五分之二。

融資完成後,DeepSeek 設立了員工持股計劃,並按實際估值分配股份。梁文鋒向身邊人強調,其戰略不會改變:繼續開源、保持低價、專注 AGI。他將 AGI 定義為機器在理解、推理、學習、規劃和適應等廣泛任務上達到人類水平。他還表示,“AI 不應該被少數人控制”。DeepSeek 是目前唯一一家將所有模型底層代碼完全公開的主要 AI 實驗室。

在美國開發者群體中,DeepSeek 的存在感正在急速膨脹。今年 4 月 發佈的旗艦模型 V4,於 5 月Vercel 的 AI Gateway 平臺上,其 token 用量份額從不到 1% 飆升至 17%,一個月內便成為該平臺僅次於 Anthropic 和 Google 的第三大模型。其輕量版 V4 Flash 的價格,比 Anthropic 的模型便宜 20 到 50 倍,這種增長勢頭在 6 月仍在延續。