生數科技發佈Vidu S1實時交互視頻模型

生數科技發佈Vidu S1模型，支持實時視頻通話、語音控制視頻走向及540P分辨率

來源:36氪 · 2026-07-03 07:55 ET · #模型

字號

生數科技正式發佈新一代視頻生成模型Vidu S1，將實時交互能力引入視頻生成領域。該模型不僅支持實時視頻通話，還允許用戶通過語音控制視頻走向，標誌著視頻生成技術從單向輸出邁向雙向互動。

在技術規格上，Vidu S1提供540P（960x540）高清分辨率，基礎幀率為25FPS，最高可支持42FPS，確保交互過程的流暢性與畫面清晰度。用戶可基於真人、動漫、萌寵等任意初始形象，搭配個性化音色，快速創建專屬的交互角色，大幅降低虛擬形象定製門檻。

這一發布正值AI視頻生成賽道競爭加劇之際。此前，多家公司已推出文本生成視頻或圖像生成視頻模型，但多數產品仍停留在單向生成階段。Vidu S1的實時交互特性，將視頻生成與語音控制、實時對話相結合，拓展了應用邊界。從虛擬主播、在線教育到遊戲NPC互動，實時可交互的視頻模型有望重塑內容生產與消費方式。

對AI產業投資者而言，生數科技此舉凸顯了應用層創新的加速趨勢。隨著底層模型能力趨於成熟，差異化交互體驗正成為企業爭奪市場份額的關鍵。Vidu S1能否在商業化落地中證明自身價值，將取決於其生態建設速度與開發者社區的響應程度。

生數科技發佈Vidu S1實時交互視頻模型

延伸閱讀

相關深度報道

相關每日新聞