6月16日,中国AI公司DeepSeek宣布完成成立以来的首轮外部融资,募集资金超过500亿元人民币,投后估值突破500亿美元。这笔交易不仅创下中国AI行业迄今规模最大的单轮融资纪录,其出资方阵容也备受关注:创始人梁文锋个人出资200亿元,为最大单一出资方;腾讯出资100亿元宁德时代体系出资约50亿元京东网易IDG资本各出资30亿元

这笔巨额资金将流向何处,是产业界关注的焦点。从近期动态看,DeepSeek的战略意图已相当清晰:它无意在消费端与豆包、千问、元宝等应用争夺用户,而是将重心放在服务开发者和企业,把模型能力转化为生产力工具,成为AI时代的“基础设施”提供商。

资金的大头预计将砸向算力。DeepSeek长期处于算力边际紧缺状态,无论是训练新一代模型,还是应对用户调用量的增长,都需要庞大的算力底座。近期,DeepSeek已在内蒙古乌兰察布招聘智算中心高级运维工程师、高级交付经理等岗位,并设立“IDC设计规划工程师”职位,规划MW到GW级的超大规模智算中心。这标志着它正从租用机房转向大规模自建数据中心。这一选择与其技术路线密切相关:DeepSeek在FP8训练、KV Cache调度、MoE负载均衡等方面进行了大量底层定制优化,这些都需要在“算法-芯片-网络-框架”每一层做深度适配,标准云服务无法满足其极致压榨算力的需求。

地基之上,另外两大投入方向是模型层执行层。6月15日,据参与测试的用户透露,DeepSeek V4.1 Flash已在网页端启动灰度测试,其代码能力实现了“天差地别”的跨越式进步,知识截止日期也大幅跃升。这表明AI Coding正是DeepSeek即将发力的核心领域。Coding之所以成为必争之地,是因为它是目前唯一可验证、可量化、可闭环的AI生产力场景——代码能否运行,计算机可直接给出pass/fail的客观判断,企业能精确计算ROI。

在执行层,DeepSeek正着力搭建Agent/Harness系统。5月的一则招聘启事中,一行简洁的公式揭示了其思路:Model+Harness=Agent。Harness负责除模型本身以外的所有工作,包括上下文管理、工具调用、终端执行、测试反馈、权限控制等,是把模型意图转化为实际行动的关键。据媒体报道,DeepSeek Harness团队的负责人是崔添翼,一位曾在Jane Street工作9年、后联合创立量化基金TSY Capital的交易系统专家。他于2026年2月加入DeepSeek,正是为了搭建这套执行系统。量化交易与AI Agent的底层逻辑相通:光有聪明的策略不赚钱,真正把策略变成钱的,是执行系统。

DeepSeek瞄准的对手是Anthropic旗下的Claude Code。Anthropic在AI Coding领域已建立起端到端的工程闭环,其模型能力与Harness工程的结合,形成了开发者习惯壁垒。当前,在SWE-bench Verified这一衡量真实世界开发者工作流的关键基准测试上,前沿模型的竞争已进入白热化:Claude Opus 4.5达到80.9%,Opus 4.6为80.8%,Gemini 3.1 Pro为80.6%,GPT-5.2为80.0%,差距仅在0.1到0.9个百分点之间。这微小的差距,意味着一个模型能独立解决复杂issue并上线运行,而另一个模型会在最后一步卡住。

6月12日,Anthropic最强大的模型Claude Fable 5Mythos 5被美国政府纳入出口管制,全球停服。这是美国首次将商业AI模型与先进半导体同等对待,纳入出口管制清单。这一事件进一步确认了AI Coding的基础设施地位。DeepSeek的低价路线——DeepSeek-V4-Flash缓存命中输入价格仅为0.2元/百万tokens——本质上是在把AI生产力从奢侈品变成日用品,推动Coding基础设施的平权化。

据参与融资的投资人转述,梁文锋对所有投资人的最大要求是“不要挖DeepSeek的人”。核心团队很稳定,离职者也不是做Coding的。当一个人坚信自己在做一件很重要的事情时,是不希望别人来挖角打扰的。DeepSeek拿着500亿,赌的是Coding真正成为像水电一样的基础设施,人人可用。这不仅对DeepSeek自己重要,对中国整个AI产业从消费叙事切换到生产叙事,也至为关键。