字节跳动旗下云服务平台火山引擎在近日的 FORCE 大会上,一口气推出了五款全新 AI 模型,其中最引人注目的是视频生成模型 Seedance 2.5。该模型计划于 7 月初正式上线,其核心突破在于能够一次性生成最长 30 秒的连续视频片段,且包含完整的场景切换与节奏变化,完全无需后期拼接。
这一能力直击当前 AI 视频生成领域的一大痛点。此前多数模型生成的视频时长较短,或需通过多次生成再拼接来实现较长内容,导致画面连贯性与叙事节奏难以保证。Seedance 2.5 的单镜头 30 秒生成,意味着它可以更自然地讲述一个完整的小故事或展示一段有起承转合的产品演示,大幅降低了后期剪辑的门槛。
除了时长突破,该模型在多模态输入上也展现出高度灵活性。它可同时接收多达 50 个额外输入,包括参考图像、音频等。这对于需要多角色、多元素协同的电影级场景构建尤为实用。用户还能在视频生成后对其进行编辑,同时保持整体视觉风格与画面质感不变,这为创意迭代提供了更大的空间。
与 Seedance 2.5 一同亮相的还有 Seedance 2.0 的升级版,后者现已支持原生 4K 分辨率与 10-bit 色深,画质表现向专业影视标准靠拢。在语言模型方面,豆包 2.1 Pro 的定价策略颇具攻击性——据火山引擎披露,其使用成本比 Anthropic 的 Claude Opus 4.6 低了约 80%。这一定价无疑将加剧企业级大模型市场的价格竞争,尤其对成本敏感的中小开发者和初创公司具有吸引力。
图像与音频领域同样有新品补位。Seedream 5.0 Pro 图像模型与 Seed-Audio 1.0 音频模型的推出,使字节跳动的 AI 模型矩阵进一步覆盖了从文本、图像、音频到视频的全模态生成能力。火山引擎作为字节跳动的 to B 出口,将这些模型以云服务形式提供给企业客户,其战略意图十分清晰:在消费端之外,抢占企业级 AI 应用的市场份额。
从产业视角看,Seedance 2.5 的发布将 AI 视频生成的竞争推向了新阶段。连贯性、时长与多模态控制的提升,直接关系到广告短片、社交媒体内容、电商展示乃至影视预演等场景的实用化程度。当单次生成即可产出可直接投放的 30 秒素材时,内容生产的工作流将被显著压缩。
值得注意的是,字节跳动此次并未孤立地发布一款视频模型,而是以“全家桶”形式更新了语言、图像、音频、视频四条产品线。这种协同打法,意在构建一个相互增强的模型生态——语言模型理解需求、图像模型生成素材、视频模型整合动态、音频模型补齐声音,最终为企业提供一站式 AI 内容生产方案。
在成本侧,豆包 2.1 Pro 的激进定价也传递出明确信号:中国云厂商在大模型服务上的价格战远未结束。对于 AI 产业投资者而言,这意味着模型层的商业化仍处于早期圈地阶段,盈利能力尚未成为首要目标,规模与生态黏性才是当前竞争的关键变量。