火山引擎以一场密集的产品发布,向生产级AI市场展示了其全面布局的野心。周二,该公司正式推出豆包大模型2.1系列,涵盖旗舰版Doubao-Seed-2.1-Pro与轻量版Doubao-Seed-2.1-Turbo,API即日在火山方舟平台全量上线。与此同时,视频生成模型Seedance 2.5宣布将于7月初正式发布,音频生成模型1.0版本也同步开启邀测。这一连串动作标志着豆包生态正从语言理解向多模态内容生产全面延伸,直接瞄准企业级开发与创作场景。

此次升级的核心看点在于性能与成本的平衡。豆包大模型2.1 Pro的定价为每百万Tokens输入6元、输出30元,而在Coding和Agent等高频生产场景下,综合成本可压缩至每百万Tokens仅1.96元。这一价格策略极具攻击性,意在降低企业接入门槛。火山引擎还推出了持续迭代版本Doubao-Seed-Evolving,以每月2至4次的频率滚动更新,企业无需更换API接入节点即可获得最新模型能力,这为追求稳定性的企业用户提供了便利。

在能力层面,豆包大模型2.1 Pro在多项基准测试中展现出与国际顶尖模型对标的实力。在Terminal Bench评测中,其表现与Claude Opus 4.7基本持平;在长程软件开发基准SWE-Pro上,接近GPT-5.5的水平。在科学计算代码评测SciCode中,该模型以59.8分超越Claude Opus 4.7和GPT-5.5,该测试覆盖数理化生材五大学科的真实科研问题,含金量颇高。火山引擎还披露了一个芯片设计案例:模型连续运行近18小时,经历9轮迭代,完成1303行RTL代码生成并通过完整工程验证,展示了生产级Coding交付能力。

Agent能力是此次升级的另一重点。在GDPval基准上,豆包大模型2.1 Pro获得最高分,该测试集覆盖9大行业、44种职业的真实经济价值任务。在2026年6月刚发布的Agents' Last Exam(ALE)评测中,其表现超越Claude Opus 4.7,该基准涵盖逾1000项高经济价值任务,且发布不久难以被定向优化,更能反映模型泛化能力。工具调用方面,模型在MCP-Atlas评测集上全面超越Claude Opus 4.7与GPT-5.5。一个典型案例是,开发者使用该模型调度超过500个Agent协同作业,累计触发工具调用上千次,完成逾100栋建筑的3D城市构建。

多模态理解能力同样保持全球领先。图像理解方面,豆包大模型2.1在MMMU-Pro等榜单上全面超越GPT-5.5、Claude Opus 4.7和Gemini 3.1 Pro。视频时序理解上,在TOMATOLVBench两项基准中大幅领先Gemini 3.1 Pro。GUI Agent方面,移动端能力大幅领先,桌面端接近Claude Opus 4.7。火山引擎展示了一个端到端视频剪辑案例:模型一次性处理逾两小时长视频,自动完成解说稿生成、片段定位、音频合成及字幕输出,全程无需人工干预。

多模态版图的拓展不止于此。据披露,视频生成模型Seedance 2.5已处于内测尾声,预计7月初正式发布。新模型支持单段视频生成时长最高30秒,镜头连贯性大幅提升,并支持最多50个全模态素材联合输入,官方称其为全球最多。音频生成模型1.0则支持文本及参考音频等多模态输入,可端到端生成包含多角色对白、背景音乐和环境音效的完整音频作品,单次支持2分钟创作,API即日开启邀测,并计划接入剪映、即梦、番茄等产品。

商业化层面,火山引擎总裁谭待披露了最新数据:截至今年6月,豆包大模型日均Token调用量已突破180万亿,较去年增长超10倍。在中国公有云MaaS服务市场,火山引擎以49.5%的市场份额位居第一。这些数字背后是国内AI应用需求的爆发式增长,也反映出豆包生态在企业市场的渗透速度。合作伙伴方面,WPS表示该模型在PPT生成、表格交付等办公核心任务上形成稳定可用链路;得到反映其在业务规则遵循上实现零违规;Unity(团结引擎)则认为其在脚本逻辑类任务上的单次能力上限高于顶尖模型。火山引擎还表示,豆包产品即将接入2.1 Pro,服务数亿用户的办公与生产力场景。

从产业视角看,火山引擎这一系列动作将直接影响国内企业AI采购格局。以极低价格提供对标国际旗舰的能力,配合高频迭代与多模态覆盖,豆包大模型正在将AI基础设施的竞争从单纯的参数比拼拉向成本、易用性与生态整合的综合较量。对于算力产业链而言,Token调用量的爆发式增长意味着推理需求将持续攀升,这对上游芯片与云基础设施供应商构成长期利好。而对于应用层开发者,更低的调用成本和更稳定的工具链支持,有望加速AI原生应用的涌现。