生数科技发布Vidu S1实时交互视频模型

生数科技发布Vidu S1模型，支持实时视频通话、语音控制视频走向及540P分辨率

来源:36氪 · 2026-07-03 07:55 ET · #模型

字号

生数科技正式发布新一代视频生成模型Vidu S1，将实时交互能力引入视频生成领域。该模型不仅支持实时视频通话，还允许用户通过语音控制视频走向，标志着视频生成技术从单向输出迈向双向互动。

在技术规格上，Vidu S1提供540P（960x540）高清分辨率，基础帧率为25FPS，最高可支持42FPS，确保交互过程的流畅性与画面清晰度。用户可基于真人、动漫、萌宠等任意初始形象，搭配个性化音色，快速创建专属的交互角色，大幅降低虚拟形象定制门槛。

这一发布正值AI视频生成赛道竞争加剧之际。此前，多家公司已推出文本生成视频或图像生成视频模型，但多数产品仍停留在单向生成阶段。Vidu S1的实时交互特性，将视频生成与语音控制、实时对话相结合，拓展了应用边界。从虚拟主播、在线教育到游戏NPC互动，实时可交互的视频模型有望重塑内容生产与消费方式。

对AI产业投资者而言，生数科技此举凸显了应用层创新的加速趋势。随着底层模型能力趋于成熟，差异化交互体验正成为企业争夺市场份额的关键。Vidu S1能否在商业化落地中证明自身价值，将取决于其生态建设速度与开发者社区的响应程度。

生数科技发布Vidu S1实时交互视频模型

延伸阅读

相关深度报道

相关每日新闻