DeepSeek首輪融資超500億，劍指AI Coding基礎設施

6月16日，中國AI公司DeepSeek宣佈完成成立以來的首輪外部融資，募集資金超過500億元人民幣，投後估值突破500億美元。這筆交易不僅創下中國AI行業迄今規模最大的單輪融資紀錄，其出資方陣容也備受關注：創始人梁文鋒個人出資200億元，為最大單一齣資方；騰訊出資100億元，寧德時代體系出資約50億元，京東、網易及IDG資本各出資30億元。

這筆鉅額資金將流向何處，是產業界關注的焦點。從近期動態看，DeepSeek的戰略意圖已相當清晰：它無意在消費端與豆包、千問、元寶等應用爭奪用戶，而是將重心放在服務開發者和企業，把模型能力轉化為生產力工具，成為AI時代的“基礎設施”提供商。

資金的大頭預計將砸向算力。DeepSeek長期處於算力邊際緊缺狀態，無論是訓練新一代模型，還是應對用戶調用量的增長，都需要龐大的算力底座。近期，DeepSeek已在內蒙古烏蘭察布招聘智算中心高級運維工程師、高級交付經理等崗位，並設立“IDC設計規劃工程師”職位，規劃MW到GW級的超大規模智算中心。這標誌著它正從租用機房轉向大規模自建數據中心。這一選擇與其技術路線密切相關：DeepSeek在FP8訓練、KV Cache調度、MoE負載均衡等方面進行了大量底層定製優化，這些都需要在“算法-芯片-網絡-框架”每一層做深度適配，標準雲服務無法滿足其極致壓榨算力的需求。

地基之上，另外兩大投入方向是模型層和執行層。6月15日，據參與測試的用戶透露，DeepSeek V4.1 Flash已在網頁端啟動灰度測試，其代碼能力實現了“天差地別”的跨越式進步，知識截止日期也大幅躍升。這表明AI Coding正是DeepSeek即將發力的核心領域。Coding之所以成為必爭之地，是因為它是目前唯一可驗證、可量化、可閉環的AI生產力場景——代碼能否運行，計算機可直接給出pass/fail的客觀判斷，企業能精確計算ROI。

在執行層，DeepSeek正著力搭建Agent/Harness系統。5月的一則招聘啟事中，一行簡潔的公式揭示了其思路：Model+Harness=Agent。Harness負責除模型本身以外的所有工作，包括上下文管理、工具調用、終端執行、測試反饋、權限控制等，是把模型意圖轉化為實際行動的關鍵。據媒體報道，DeepSeek Harness團隊的負責人是崔添翼，一位曾在Jane Street工作9年、後聯合創立量化基金TSY Capital的交易系統專家。他於2026年2月加入DeepSeek，正是為了搭建這套執行系統。量化交易與AI Agent的底層邏輯相通：光有聰明的策略不賺錢，真正把策略變成錢的，是執行系統。

DeepSeek瞄準的對手是Anthropic旗下的Claude Code。Anthropic在AI Coding領域已建立起端到端的工程閉環，其模型能力與Harness工程的結合，形成了開發者習慣壁壘。當前，在SWE-bench Verified這一衡量真實世界開發者工作流的關鍵基準測試上，前沿模型的競爭已進入白熱化：Claude Opus 4.5達到80.9%，Opus 4.6為80.8%，Gemini 3.1 Pro為80.6%，GPT-5.2為80.0%，差距僅在0.1到0.9個百分點之間。這微小的差距，意味著一個模型能獨立解決複雜issue並上線運行，而另一個模型會在最後一步卡住。

6月12日，Anthropic最強大的模型Claude Fable 5和Mythos 5被美國政府納入出口管制，全球停服。這是美國首次將商業AI模型與先進半導體同等對待，納入出口管制清單。這一事件進一步確認了AI Coding的基礎設施地位。DeepSeek的低價路線——DeepSeek-V4-Flash緩存命中輸入價格僅為0.2元/百萬tokens——本質上是在把AI生產力從奢侈品變成日用品，推動Coding基礎設施的平權化。

據參與融資的投資人轉述，梁文鋒對所有投資人的最大要求是“不要挖DeepSeek的人”。核心團隊很穩定，離職者也不是做Coding的。當一個人堅信自己在做一件很重要的事情時，是不希望別人來挖角打擾的。DeepSeek拿著500億，賭的是Coding真正成為像水電一樣的基礎設施，人人可用。這不僅對DeepSeek自己重要，對中國整個AI產業從消費敘事切換到生產敘事，也至為關鍵。

DeepSeek首輪融資超500億，劍指AI Coding基礎設施

延伸閱讀

相關深度報道

相關每日新聞