OpenAI的新一代旗舰模型GPT-5.6据报即将面世,科技媒体testingcatalog在6月19日的报道中指出,发布窗口锁定在6月22日至28日,系列将包含mini、标准版和Pro三个版本。这一消息迅速点燃市场预期,预测平台Polymarket上该窗口的概率一度冲高至八成,但随后X平台出现帖文称GPT-5.6因内部问题推迟,概率骤降至不足三成,相关合约总交易量已突破100万美元。OpenAI首席科学家Jakub Pachocki在内部向员工表示,GPT-5.6是对前代GPT-5.5的“有意义的改进”,而OpenAI Codex后端路由日志中短暂出现的“gpt-5.6”标识,以及部分ChatGPT Pro用户据报已接触到的早期隐秘测试版本,都进一步印证了发布的临近。测试反馈显示,在相同提示词下,输出质量有显著提升。
从技术层面看,GPT-5.6最引人注目的升级在于其从“语言模型”向“可执行Agent”的跨越。据报道,上下文窗口从100万tokens扩展至约150万tokens,较GPT-5.5提升约43%,这为处理更长周期的编码任务和多步会话提供了基础。词元效率据称也再度提升10%至15%,意味着在相同费用下可处理更多工作量。泄露的测试反馈揭示了三项关键能力:视觉复刻,可将设计稿直接还原为可运行代码;SVG 3D对象生成,支持在浏览器内旋转与缩放;以及Playwright浏览器自动化,能真实执行点击、输入、页面跳转等操作。这三项能力的组合,使GPT-5.6不再只是一个给出建议的对话工具,而具备了直接在用户设备上执行操作的能力。有X平台网友形象地评论称,GPT-5.6“脑子还是那个脑子,但他已经长出手了”,一个能聊天、告诉你该怎么做的人,现在能打开你的浏览器,移动你的鼠标,复制一个设计,生成一个3D图标,保存到桌面上。在智能体编码场景中,GPT-5.6的表现据称已优于Anthropic的Mythos系列,SVG生成能力亦被指超越Claude Fable 5。此外,GPT-5.5版本中存在的部分对齐问题,包括reward hacking,据报也在新版本中得到修复。
在商业策略上,GPT-5.6或将成为OpenAI以价格战扩大市场份额的关键棋子。据媒体报道,其token价格可能仅为Claude Fable 5的约三分之一,延续了OpenAI当前token价格约为Anthropic一半的定价优势。分析认为,在性能持平乃至领先的前提下,OpenAI通过大幅降价压缩对手的市场空间,加速企业级客户向自身平台迁移。这一策略折射出头部AI厂商之间愈发激烈的迭代竞争。据aiweekly.co报道,OpenAI旗舰模型的发布节奏已明显加速,从GPT-5.4到GPT-5.5的间隔约为六周,GPT-5.6或延续了这一节奏。与此同时,Anthropic的Fable 5及Opus系列、Google Gemini等竞品也在同期保持高频更新,部分社区已将6月下旬视为“AI大事件周”。
不过,围绕GPT-5.6的期待并非一边倒。近日多名用户反映GPT-5.5出现“降智”现象,有用户直接揣测OpenAI正在后台测试GPT-5.6,认为“这就是Codex现在这么蠢的原因”。用户Hyper-Jason则补充,软件表现异常源于集成问题,“这几乎是他们一贯的历史”,同时希望GPT-5.6“不像之前的GPT-5模型那么受限”。X平台中文用户也吐槽GPT-5.5性能下降,戏称“如果你三天内不出GPT-5.6我就不原谅你了”。在Reddit上,有网友提醒外界降低预期,指出5.6仅为小版本迭代,参数规模不会大幅跃升。一位用户写道:“如果版本号是5.6(也就是一个小版本迭代,不是新版本),那大家就得降低期望值了。Fable之所以有自己的版本号,是因为它是一个新版本,而不是旧版本的迭代。而5.6应该是一个迭代版本,而不是新版本。”从参数规模角度看,Reddit网友分析称,Fable大约是6T级模型,GPT-5.5约2T级,GPT-5.6预计不会在参数规模上跳跃2至3倍,真正的模型级别突破需等待GPT-6。这些声音提醒市场,尽管Agent化能力和定价策略令人瞩目,但GPT-5.6在底层模型规模上可能仍属渐进式升级。
对于AI产业投资者而言,GPT-5.6的发布节奏和定价策略直接牵动模型层的竞争格局。若其Agent能力如期落地,并以三分之一的价格冲击Anthropic等对手,可能加速企业客户从多模型评估转向OpenAI生态,进一步巩固其商业护城河。同时,发布的不确定性和社区对“小迭代”的定位,也意味着短期市场反应可能分化,真正的估值重估或需等待GPT-6等下一次模型级别跃升。