OpenAI近期披露的内部数据显示,其自研AI编程工具Codex在公司各部门的使用强度正经历指数级攀升,这为外界观察前沿AI机构如何实际部署自身技术提供了难得的窗口。

根据OpenAI经济研究团队的报告,以2025年11月为基准,到2026年6月,内部活跃用户通过Codex产生的中位输出token量在不同职能部门均出现大幅增长。其中,研究部门的增幅最为惊人,达到56倍客户支持部门紧随其后,增长32倍工程部门增长27倍;即便是增长相对温和的法务部门,也达到了13倍的水平。

这一数据揭示的趋势远不止于“用得更频繁”。报告指出,Codex的使用模式正从早期的简单代码补全,转向处理更长周期、跨职能的复杂任务。OpenAI内部将其描述为“智能体正在改变每一个部门的工作方式”,暗示Codex已深度嵌入到研究探索、客户问题解决、工程构建乃至法律文书处理等核心业务流程中,成为执行持久化工作流的关键组件。

值得注意的背景是,OpenAI员工一直享有Codex的无限制使用权。然而,直到2025年底,其内部token消耗中仅有不到10%流向Codex,大部分使用仍集中在对话式交互上。这意味着,即便在最懂AI的人群中,深度采用也并非一蹴而就,而是经历了一个从浅层尝试到将AI作为核心生产力引擎的“酝酿期”。此次token量的爆发,标志着这一转变已跨过关键临界点。

从产业视角看,这一内部数据与当前企业级AI应用的两大趋势相呼应。其一,是智能体基础设施的成熟。近期多家创业公司如Sail(融资8000万美元)和Hyperagent,均在专门为运行数天甚至数周的长期智能体优化推理成本与沙箱环境,LangChain也提出了区分“通用聊天”与“专用持久化智能体”的框架。OpenAI内部Codex的用法演变,恰好印证了市场对这类长周期、有状态智能体工具的需求。其二,是评估体系的挑战。Cursor的研究指出,部分先进模型已能通过检索互联网或代码历史来“破解”公共基准测试,这使得单纯看跑分排名的意义下降。OpenAI内部token消耗的实据,反而成为衡量AI实际生产力更可靠的先行指标。

不过,解读这一数据时也需保持审慎。内部员工的无限使用权限与高度配合的集成环境,是多数外部企业尚不具备的条件。研究部门56倍的token增长,可能部分源于实验性质的反复生成与评估,未必直接等同于56倍的效率提升。但无论如何,这一内部基准为市场提供了关键信号:当最前沿的AI实验室自身开始以指数级速度消耗推理算力时,整个产业的算力需求叙事和AI应用的价值兑现预期,都将获得新的支撑。