《华尔街日报》6月11日的报道揭示了一个正在AI产业内部快速发酵的趋势:越来越多的美国企业和初创公司开始“弃贵选廉”,从OpenAIAnthropic等价格高昂的闭源模型,转向来自中国的DeepSeek、智谱AI的GLM等开源模型。这一转向的核心驱动力是成本——部分企业反馈,在特定场景下,通过动态切换模型,某些AI辅助工作的成本可以降低高达95%。

成本压力的直接体现,是行业巨头态度的转变。OpenAI CEO萨姆·奥尔特曼在最近一次内部活动中坦言,成本已经突然成为“一个大问题”。据知情人士透露,OpenAI正在考虑大幅降价,而外界普遍预计其主要竞争对手Anthropic也可能跟进。这对于两家均已向美国SEC秘密提交潜在IPO文件的公司而言,无疑是一个敏感时刻。如果被迫大幅降价,它们本就庞大的算力支出与亏损可能进一步扩大,实现盈利的时间表将被推迟。

报道中列举了多个具体案例,勾勒出企业如何精打细算地重构自己的模型使用策略。美国AI识别Bug公司Detail的创始人丹·罗宾逊表示,他已将公司约90%的工作负载从Anthropic的Claude和谷歌的Gemini,迁移到了自家定制模型以及中国的GLM模型上。他的逻辑很直接:一旦找到运行良好且工程师喜欢的模型,就想办法让成本可控,而目前开源模型的资源非常丰富。

另一家AI助手初创公司Lindy的实践更具说服力。该公司两个月前开始测试DeepSeek的V4模型,其创始人Flo Crivello称,在处理收件箱、日历管理、邮件草拟和会议转录等日常任务上,DeepSeek的表现与Anthropic的Sonnet相当,但成本仅约为后者的十分之一,仅此一项就为公司节省了数百万美元。

这种成本差异在token计价层面显得尤为悬殊。报道指出,Anthropic 6月9日发布的新模型Claude Fable 5,每token价格是DeepSeek V4 Pro的50倍以上。在简单任务中,使用DeepSeek的成本仅约为闭源模型的2%。哥伦比亚大学工程学院副院长Vishal Misra的评论点出了这一变化的本质:“你不需要一个懂量子引力的模型。开源模型能力已经非常强,高额AI溢价的空间将减小。”

开源模型的份额增长数据也印证了这一趋势。AI开发平台Vercel的数据显示,DeepSeek在该平台上的AI使用份额从4月的不足1%激增至5月的17%。在AI路由平台OpenRouter上,自5月中旬以来,DeepSeek的市场份额一直占据第一。该平台还指出,从2025年秋到2026年春,其高消费客户群中开源模型token使用量增长速度是闭源模型的4倍,已有超过500家机构从专有模型切换到开源模型。

不过,这并不意味着闭源模型的护城河已经消失。研究人员指出,OpenAI、Anthropic或谷歌的顶级闭源模型在复杂任务上仍领先开源竞品约4-6个月。在某些情况下,闭源模型可以用更少token完成任务,从而平衡综合使用成本。Anthropic发言人也强调,企业越来越多地按“每任务价格”而非单个token成本来评估模型,且Anthropic本身也提供价格更低的模型版本。

面对开源模型的冲击,科技巨头们并非无动于衷。微软上周推出了一系列小型AI模型,强调其运行效率更高。英伟达也推出了较便宜的Nemotron模型系列,并投资了开源AI初创公司Reflection。这些动作显示,即便是在闭源阵营内部,降低成本、提供更具性价比的选择也已成为明确的战略方向。

企业实际采用的策略正演变为一种“混合模式”:日常任务使用开源模型,复杂任务则留给闭源旗舰模型。智能路由工具的普及让这种精打细算的方式更容易实施。前谷歌云AI负责人Andrew Moore形容道,如今的AI变得非常“节约”和“精打细算”,它们完全知道如何用最便宜的模型完成任务,只有遇到难题时,才会临时切换到价格更高、能力更强的模型。

这场由成本驱动的模型选择变迁,其影响远不止于几家公司的财务报表。它可能从根本上改变AI基础设施的投资逻辑、模型商业化的定价模式,以及企业级AI应用的普及速度。Citadel Securities本周发布的报告也显示AI支出指数近期出现下降,并指出即使最先进的技术,也必须经历成本曲线、产能限制和边际收益的考验。OpenAI认为自己仍有优势,过去一年投入巨资锁定了远低于市场的算力资源,这或许能支撑其在价格战中坚持更久。但随着开源模型能力的持续提升,闭源模型能否依靠性能优势维持溢价,将是未来一年较大的悬念。可以确定的是,AI价格战才刚刚开始。