生數科技正式發佈新一代視頻生成模型Vidu S1,將實時交互能力引入視頻生成領域。該模型不僅支持實時視頻通話,還允許用戶通過語音控制視頻走向,標誌著視頻生成技術從單向輸出邁向雙向互動。
在技術規格上,Vidu S1提供540P(960x540)高清分辨率,基礎幀率為25FPS,最高可支持42FPS,確保交互過程的流暢性與畫面清晰度。用戶可基於真人、動漫、萌寵等任意初始形象,搭配個性化音色,快速創建專屬的交互角色,大幅降低虛擬形象定製門檻。
這一發布正值AI視頻生成賽道競爭加劇之際。此前,多家公司已推出文本生成視頻或圖像生成視頻模型,但多數產品仍停留在單向生成階段。Vidu S1的實時交互特性,將視頻生成與語音控制、實時對話相結合,拓展了應用邊界。從虛擬主播、在線教育到遊戲NPC互動,實時可交互的視頻模型有望重塑內容生產與消費方式。
對AI產業投資者而言,生數科技此舉凸顯了應用層創新的加速趨勢。隨著底層模型能力趨於成熟,差異化交互體驗正成為企業爭奪市場份額的關鍵。Vidu S1能否在商業化落地中證明自身價值,將取決於其生態建設速度與開發者社區的響應程度。