生数科技正式发布新一代视频生成模型Vidu S1,将实时交互能力引入视频生成领域。该模型不仅支持实时视频通话,还允许用户通过语音控制视频走向,标志着视频生成技术从单向输出迈向双向互动。

在技术规格上,Vidu S1提供540P(960x540)高清分辨率,基础帧率为25FPS,最高可支持42FPS,确保交互过程的流畅性与画面清晰度。用户可基于真人、动漫、萌宠等任意初始形象,搭配个性化音色,快速创建专属的交互角色,大幅降低虚拟形象定制门槛。

这一发布正值AI视频生成赛道竞争加剧之际。此前,多家公司已推出文本生成视频或图像生成视频模型,但多数产品仍停留在单向生成阶段。Vidu S1的实时交互特性,将视频生成与语音控制、实时对话相结合,拓展了应用边界。从虚拟主播、在线教育到游戏NPC互动,实时可交互的视频模型有望重塑内容生产与消费方式。

对AI产业投资者而言,生数科技此举凸显了应用层创新的加速趋势。随着底层模型能力趋于成熟,差异化交互体验正成为企业争夺市场份额的关键。Vidu S1能否在商业化落地中证明自身价值,将取决于其生态建设速度与开发者社区的响应程度。