6月16日,中國AI公司DeepSeek宣佈完成成立以來的首輪外部融資,募集資金超過500億元人民幣,投後估值突破500億美元。這筆交易不僅創下中國AI行業迄今規模最大的單輪融資紀錄,其出資方陣容也備受關注:創始人梁文鋒個人出資200億元,為最大單一齣資方;騰訊出資100億元寧德時代體系出資約50億元京東網易IDG資本各出資30億元

這筆鉅額資金將流向何處,是產業界關注的焦點。從近期動態看,DeepSeek的戰略意圖已相當清晰:它無意在消費端與豆包、千問、元寶等應用爭奪用戶,而是將重心放在服務開發者和企業,把模型能力轉化為生產力工具,成為AI時代的“基礎設施”提供商。

資金的大頭預計將砸向算力。DeepSeek長期處於算力邊際緊缺狀態,無論是訓練新一代模型,還是應對用戶調用量的增長,都需要龐大的算力底座。近期,DeepSeek已在內蒙古烏蘭察布招聘智算中心高級運維工程師、高級交付經理等崗位,並設立“IDC設計規劃工程師”職位,規劃MW到GW級的超大規模智算中心。這標誌著它正從租用機房轉向大規模自建數據中心。這一選擇與其技術路線密切相關:DeepSeek在FP8訓練、KV Cache調度、MoE負載均衡等方面進行了大量底層定製優化,這些都需要在“算法-芯片-網絡-框架”每一層做深度適配,標準雲服務無法滿足其極致壓榨算力的需求。

地基之上,另外兩大投入方向是模型層執行層。6月15日,據參與測試的用戶透露,DeepSeek V4.1 Flash已在網頁端啟動灰度測試,其代碼能力實現了“天差地別”的跨越式進步,知識截止日期也大幅躍升。這表明AI Coding正是DeepSeek即將發力的核心領域。Coding之所以成為必爭之地,是因為它是目前唯一可驗證、可量化、可閉環的AI生產力場景——代碼能否運行,計算機可直接給出pass/fail的客觀判斷,企業能精確計算ROI。

在執行層,DeepSeek正著力搭建Agent/Harness系統。5月的一則招聘啟事中,一行簡潔的公式揭示了其思路:Model+Harness=Agent。Harness負責除模型本身以外的所有工作,包括上下文管理、工具調用、終端執行、測試反饋、權限控制等,是把模型意圖轉化為實際行動的關鍵。據媒體報道,DeepSeek Harness團隊的負責人是崔添翼,一位曾在Jane Street工作9年、後聯合創立量化基金TSY Capital的交易系統專家。他於2026年2月加入DeepSeek,正是為了搭建這套執行系統。量化交易與AI Agent的底層邏輯相通:光有聰明的策略不賺錢,真正把策略變成錢的,是執行系統。

DeepSeek瞄準的對手是Anthropic旗下的Claude Code。Anthropic在AI Coding領域已建立起端到端的工程閉環,其模型能力與Harness工程的結合,形成了開發者習慣壁壘。當前,在SWE-bench Verified這一衡量真實世界開發者工作流的關鍵基準測試上,前沿模型的競爭已進入白熱化:Claude Opus 4.5達到80.9%,Opus 4.6為80.8%,Gemini 3.1 Pro為80.6%,GPT-5.2為80.0%,差距僅在0.1到0.9個百分點之間。這微小的差距,意味著一個模型能獨立解決複雜issue並上線運行,而另一個模型會在最後一步卡住。

6月12日,Anthropic最強大的模型Claude Fable 5Mythos 5被美國政府納入出口管制,全球停服。這是美國首次將商業AI模型與先進半導體同等對待,納入出口管制清單。這一事件進一步確認了AI Coding的基礎設施地位。DeepSeek的低價路線——DeepSeek-V4-Flash緩存命中輸入價格僅為0.2元/百萬tokens——本質上是在把AI生產力從奢侈品變成日用品,推動Coding基礎設施的平權化。

據參與融資的投資人轉述,梁文鋒對所有投資人的最大要求是“不要挖DeepSeek的人”。核心團隊很穩定,離職者也不是做Coding的。當一個人堅信自己在做一件很重要的事情時,是不希望別人來挖角打擾的。DeepSeek拿著500億,賭的是Coding真正成為像水電一樣的基礎設施,人人可用。這不僅對DeepSeek自己重要,對中國整個AI產業從消費敘事切換到生產敘事,也至為關鍵。